Pinecone lança seu banco de dados vetorial sem servidor fora do preview

Pinecone, a startup de banco de dados vetoriais fundada por Edo Liberty, ex-chefe dos Laboratórios de IA da Amazon, tem estado na vanguarda de ajudar as empresas a aumentar os grandes modelos de linguagem (LLMs) com seus próprios dados. Recentemente, no entanto, a empresa reestruturou completamente seu produto para lançar o Pinecone Serverless, que liberta seus clientes da necessidade de pensar em gerenciar suas implantações e dimensioná-las. Hoje, o Pinecone Serverless sai da versão beta e está agora disponível para o público em geral. Liberty observa que os primeiros clientes da empresa estão agora fazendo a transição de experimentar a IA generativa para querer lançar seus próprios produtos de IA. A empresa observou as empresas lidando com a complexidade de construir novas aplicações ao mesmo tempo em que tentavam descobrir a melhor maneira de colocá-las em produção. "A primeira onda de aplicações de qualidade de produção está chegando ao mercado agora e nos próximos seis a nove meses. O que mais de 5.000 clientes nos disseram claramente é que eles precisam de uma ferramenta especializada dedicada, otimizada e extremamente eficiente em busca de vetores, em fazer RAG, extrair conhecimento e gerar contexto para esses modelos de linguagem. O que eles estavam realmente dizendo é: ei, eu preciso de escala, eu preciso de desempenho e preciso que os custos sejam de tal forma que eu possa raciocinar sobre o produto que estou construindo." Liberty enfatizou que o Pinecone dedicou muito tempo para preparar o produto para implantações de produção, ao mesmo tempo em que o tornava significativamente mais acessível. A empresa realmente acredita que os clientes que usam o Pinecone Serverless podem reduzir seus custos em até 50x, em parte porque a equipe reestruturou o sistema para ser um serviço multi-inquilino que desacopla armazenamento e computação. Com isso, os clientes do Pinecone só pagam quando consomem tempo de CPU, com a empresa orquestrando a capacidade nos bastidores. "Como executamos tudo como um serviço, nossa capacidade de orquestrar tudo isso nos torna capazes de cobrar as pessoas exatamente pelo que usam - e nada mais. Isso é incrivelmente raro e incrivelmente difícil de fazer," disse Liberty. Durante a prévia pública, os clientes do Pinecone também solicitaram uma série de recursos adicionais. Um deles é os Pontos Finais Privados, que está sendo lançado na prévia pública hoje. Isso permite que as empresas criem uma conexão direta com suas nuvens privadas virtuais na Amazon via AWS PrivateLink, que não expõe seus dados à internet pública para garantir que os dados permaneçam dentro dos vários regimes de governança e conformidade que uma empresa pode ter que seguir. Algumas das empresas que já estão utilizando o Pinecone Serverless incluem Gong, Help Scout, New Relic, Notion, TaskUS e You.com. "A Notion está liderando a revolução de produtividade da IA," disse Akshay Kothari, co-fundador e COO da Notion. "Nosso lançamento de um recurso de IA pioneiro no mercado foi possibilitado pelo Pinecone Serverless. Sua tecnologia permite que nossa IA de Q&A forneça respostas instantâneas a milhões de usuários, obtidas a partir de bilhões de documentos. O melhor de tudo, nossa transição para sua arquitetura mais recente reduziu nossos custos em 60%, avançando nossa missão de tornar a criação de ferramentas de software ubíqua."