BigQuery ML Aprimorado com Funções de IA Generativa e Suporte a Iceberg
18 de novembro de 2025 - O Google Cloud anuncia atualizações significativas para o BigQuery ML, expandindo suas capacidades em análise de dados e inteligência artificial. As novidades incluem a automação avançada na criação de tabelas BigLake para Apache Iceberg e a introdução de um conjunto robusto de funções de IA generativa.
Dataform Facilita a Criação de Tabelas Iceberg em BigQuery
Uma das atualizações de destaque é a nova funcionalidade do Dataform, que agora permite automatizar a criação de tabelas BigLake para Apache Iceberg diretamente no BigQuery. Este recurso, que alcançou o status de General Availability (GA), simplifica o gerenciamento de dados em larga escala e a integração com ecossistemas de dados abertos, como o Apache Iceberg, diretamente na plataforma BigQuery.
Revolução com IA Generativa no BigQuery ML
O BigQuery ML introduziu um conjunto poderoso de funções de IA generativa, impulsionando novas possibilidades para análise e manipulação de dados não estruturados:
AI.GENERATE(GA): Permite a geração de texto livre para diversas tarefas, como tradução, sumarização e classificação. A função é versátil, podendo operar sobre dados não estruturados como imagens, áudio, vídeo e documentos, além de realizar extração de entidades e gerar saídas estruturadas.AI.EMBED(Preview): Transforma textos, imagens, áudio, vídeo ou documentos em embeddings. Essa funcionalidade é crucial para tarefas de busca semântica, recomendação e análise de similaridade.AI.SIMILARITY(Preview): Computa a similaridade semântica entre pares de textos, imagens, ou entre texto e imagem. Essencial para entender relações e padrões em dados multimodais.- Funções auxiliares como
AI.GENERATE_BOOL,AI.GENERATE_DOUBLEeAI.GENERATE_INTforam introduzidas para gerar valores escalares, otimizando processos de filtragem, pontuação e contagem. - Todas as funções de IA generativa suportam autenticação com credenciais de usuário final (EUC), facilitando a configuração das permissões necessárias no Vertex AI.
Novas Funções de IA Generativa em Tabela
Além das funções escalares, o BigQuery ML agora oferece funções de IA generativa que retornam tabelas:
AI.GENERATE_TABLE(GA): Gera tabelas com saídas estruturadas a partir de dados não estruturados como texto, imagens, áudio e vídeo.AI.GENERATE_TEXT: Representa a versão mais recente e recomendada deML.GENERATE_TEXT, com a mesma funcionalidade, mas com nomes de colunas de saída simplificados.AI.GENERATE_EMBEDDING: Nova versão preferencial deML.GENERATE_EMBEDDING, oferecendo a mesma funcionalidade com nomes de colunas de saída mais intuitivos.- Todas essas funções de tabela também estão em General Availability (GA).
Integração com Gemini 3.0
O BigQuery ML agora permite o uso do modelo **Gemini 3.0** ao chamar funções de IA generativa, como AI.GENERATE. Para utilizar este modelo avançado, é necessário empregar o endpoint global completo: https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/google/models/gemini-3-pro-preview.
Publicação de Data Insights no Dataplex Universal Catalog
Em fase de Preview, os usuários agora podem publicar insights de dados, incluindo recomendações de consulta e descrições de tabelas e colunas geradas automaticamente, diretamente no Dataplex Universal Catalog. Esta integração visa aprimorar a governança e a descoberta de dados em ambientes corporativos.
💡 Opinião do Editor
Como Data Manager e alguém que respira o ecossistema Google Cloud e o universo dos dados, vejo esses avanços no BigQuery ML não apenas como uma evolução técnica, mas como uma verdadeira mudança de paradigma na gestão e exploração de informações. A automação da criação de tabelas BigLake para Iceberg via Dataform é um divisor de águas; ela simplifica drasticamente a governança, garante interoperabilidade essencial e libera nossos engenheiros de dados de tarefas repetitivas, permitindo que se concentrem em arquiteturas de maior valor e complexidade. É a fundação para ecossistemas de dados mais robustos e resilientes.
Mais impactante ainda é a democratização da IA generativa diretamente no BigQuery. As novas funções AI.GENERATE e AI.EMBED, aliadas à integração com Gemini 3.0, transformam a análise de dados não estruturados de um desafio proibitivo para uma oportunidade tangível. Não se trata mais de silos; agora podemos extrair insights profundos de textos, áudios e vídeos diretamente onde nossos dados estruturados já residem, acelerando o tempo de valor e capacitando analistas a explorar dimensões antes inatingíveis. Para equipes de dados, isso significa o fim de integrações complexas e a promessa de inteligência preditiva e contextual em escala.
Minha recomendação prática para qualquer líder de dados é clara: invistam na capacitação das suas equipes para estas novas ferramentas. Não basta apenas saber que elas existem; é preciso entender como integrá-las à sua estratégia de dados para desbloquear novos insights e otimizar processos. Comecem com projetos-piloto focados em dados não estruturados que hoje são subutilizados. O futuro da análise de dados passa por essa convergência inteligente, e as equipes que se adaptarem primeiro colherão os maiores frutos da inovação.
chat_bubble Comentários (0)
Nenhum comentário ainda. Seja o primeiro a comentar!
Deixe seu comentário