Las funciones de inteligencia artificial de BigQuery de Google evolucionaron significativamente a lo largo de 2025 y hasta 2026. Las funciones fundamentales AI.GENERATE y AI.GENERATE_TABLE estuvieron disponibles de forma general a finales de enero de 2026, mientras que Google presentó tres nuevas funciones de IA gestionada (AI.IF, AI.SCORE y AI.CLASSIFY) en versión preliminar pública en noviembre de 2025.
Estas funciones eliminan la necesidad de utilizar scripts de Python en la mayoría de los flujos de trabajo de análisis de datos. Si sigues exportando archivos CSV para categorizar miles de variantes de anuncios de forma manual, esta guía muestra lo que ahora es posible hacer directamente en SQL.
¿Qué son las funciones de IA de BigQuery?
Las funciones de IA de BigQuery te permiten llamar a los modelos de Gemini directamente desde las consultas de SQL. En lugar de crear sentencias CASE complejas o escribir scripts de Python para clasificar los datos, puedes escribir instrucciones en lenguaje natural directamente en tus consultas y dejar que la IA se encargue de la interpretación.
Funciones de IA de uso general (disponibles de forma general)
Dos funciones principales pasaron a ser públicas a finales de enero de 2026:
- AI.GENERATE: Devuelve datos estructurados (JSON, STRUCT) en función de su solicitud
- AI.GENERATE_TABLE: Devuelve una tabla completa con el esquema que defina
Funciones de IA gestionadas (versión preliminar pública)
Tres funciones administradas adicionales se lanzaron en noviembre de 2025 y actualmente se encuentran en versión preliminar pública:
- AI.IF: Filtra y une datos según el significado semántico
- PUNTUACIÓN DE IA: Califica y clasifica las entradas según criterios de lenguaje natural
- AI.CLASIFICAR: Clasifique el texto o las imágenes en categorías definidas por el usuario
Todas las funciones funcionan con texto, imágenes, vídeo, audio y archivos PDF. De acuerdo con Documentación de BigQuery ML de Google Cloud, puede usar estas funciones en cualquier lugar de SQL: SELECT, WHERE, ORDER BY, GROUP BY.
La versión de GA trajo una autenticación simplificada. Ahora puede usar las credenciales de usuario final en lugar de administrar los permisos de las cuentas de servicio. Además, ahora están disponibles la compatibilidad total con Gemini 3.0 Pro (que se lanzó en noviembre de 2025) y las nuevas funciones de búsqueda semántica AI.EMBED y AI.SIMILARITY.
El descripción general de la IA generativa cubre todo el conjunto de funciones, incluida la compatibilidad con los modelos Anthropic Claude y Mistral si los prefieres en lugar de Gemini.
Cómo usar las funciones de IA de BigQuery: configuración
Antes de empezar, debes conectar BigQuery a los modelos Gemini de Vertex AI. La configuración tarda unos 5 minutos una vez que conoces los pasos.
Habilita dos API en Google Cloud Console:
- API de conexión de BigQuery
- API Vertex AI
Cree una conexión externa:
Ve a BigQuery, luego a Conexiones externas, luego a Agregar conexión y, a continuación, a los modelos remotos de Vertex AI. Ponle un nombre (como conexión Vertex_ai) y haga coincidir la región de su conjunto de datos. Esto es importante para la latencia.
Otorgue los permisos correctos:
Copie el correo electrónico de la cuenta de servicio que aparece, diríjase a IAM y Admin y añada la función «Usuario de Vertex AI» a esa cuenta. Se trata de un error de configuración habitual. Sin esta función, todas las consultas fallan y producen errores de permiso.
Crea tu modelo remoto:
CREATE OR REPLACE MODEL `project.dataset.gemini_model`
REMOTE WITH CONNECTION `project.us.vertex_ai_connection`
OPTIONS (ENDPOINT = 'gemini-2.0-flash-001');
Para Gemini 3.0 Pro:
OPTIONS (ENDPOINT = 'gemini-3-pro');
Una vez configurado el modelo, puede empezar a ejecutar consultas. Esto es lo que se puede hacer con las funciones de IA de BigQuery.
7 consultas prácticas de marketing
Estos siete casos de uso resuelven problemas reales de marketing. Cada ejemplo muestra cómo estructurar las consultas y qué información está disponible.
1. Clasifique los titulares de los anuncios por desencadenante emocional
Supongamos que tienes varios miles de titulares de Google Ads y quieres saber qué factores emocionales generan conversiones. El etiquetado manual no es realista para ese volumen.
SELECT
headline,
clicks,
impressions,
AI.GENERATE(
MODEL `project.dataset.gemini_model`,
headline,
'Classify into one category: urgency, curiosity, benefit, neutral. Return only the category.'
) AS emotion_type
FROM `project.dataset.google_ads_headlines`
WHERE impressions > 1000
ORDER BY clicks DESC;
La consulta se ejecuta en minutos. En las campañas B2B, es posible que descubras que los titulares de «curiosidad» superan significativamente los ángulos de «urgencia». El tipo de patrón que permanece oculto cuando se revisan manualmente miles de variantes.
Importante: Si no haces las consultas por lotes correctamente, es posible que esperes más de 20 minutos para obtener los resultados. Filtra los datos con cláusulas WHERE antes de que se ejecute AI.GENERATE.
2. Extraiga los puntos débiles de los clientes de las reseñas
SELECT * FROM AI.GENERATE_TABLE(
MODEL `project.dataset.gemini_model`,
TABLE `project.dataset.customer_reviews`,
STRUCT(
'Extract the main complaint as a short phrase (max 10 words).' AS prompt,
'pain_point STRING, severity STRING' AS output_schema
)
)
WHERE severity = 'high'
GROUP BY pain_point
ORDER BY COUNT(*) DESC
LIMIT 5;
Este enfoque extrae datos estructurados de las reseñas de los clientes que muestran qué quejas aparecen con más frecuencia. Un patrón común: los clientes mencionan cientos de veces en las reseñas cuestiones como «el paquete llega dañado», pero solo presentan un puñado de solicitudes de soporte. Las personas se quejan en las reseñas, no ante los equipos de soporte.
La empresa danesa de caramelos Lakrids by Bülow utilizó un análisis de opinión similar en los comentarios de los clientes, identificó un aumento significativo en las quejas sobre empaques, actualizó el diseño de sus empaques y redujo las quejas en un 26%, según sus datos de servicio al cliente.
Advertencia justa: AI.CLASSIFY a veces es creativo con las categorías de gravedad. Compruebe siempre los primeros 50 a 100 resultados antes de confiar en el conjunto de datos completo.
3. Genere conceptos de campaña a partir de sus mejores artistas
En lugar de hacer una lluvia de ideas en el vacío, dale a Gemini tus principales campañas y pide variaciones.
WITH top_campaigns AS (
SELECT campaign_name, ad_copy, roas
FROM `project.dataset.facebook_ads_performance`
WHERE roas > 3.0
ORDER BY roas DESC
LIMIT 10
)
SELECT AI.GENERATE(
MODEL `project.dataset.gemini_model`,
CONCAT(
'Based on these high-ROAS campaigns: ',
STRING_AGG(CONCAT(campaign_name, ' - ', ad_copy), ', '),
'. Generate 5 new campaign concepts following similar patterns. Numbered list.'
)
) AS campaign_ideas
FROM top_campaigns;
Si las campañas de «descuentos por tiempo limitado» alcanzan constantemente un ROAS superior a 3.0, Gemini sugiere variantes como el «acceso anticipado exclusivo» o el «precio VIP». Ángulos que siguen los mismos desencadenantes psicológicos, pero con mensajes nuevos.
4. Rastrea el sentimiento a escala
Este es un patrón de consulta que funciona bien para rastrear la percepción de la marca:
SELECT
DATE_TRUNC(comment_date, MONTH) AS month,
AI.GENERATE(
MODEL `project.dataset.gemini_model`,
comment_text,
'Sentiment: positive, negative, or neutral. One word only.'
) AS sentiment,
COUNT(*) AS comments
FROM `project.dataset.social_comments`
WHERE comment_date >= '2025-01-01'
GROUP BY month, sentiment
ORDER BY month DESC;
Realice un seguimiento de la percepción de la marca en decenas de miles de comentarios sociales mes tras mes, todo en SQL. Cuando el sentimiento cae de manera significativa, sabes que algo ha cambiado. Luego, puedes investigar qué temas o productos específicos reciben menciones negativas.
5. Clasifique las páginas de destino por etapa de embudo
Esta consulta ayuda a identificar hacia dónde va realmente el presupuesto pagado:
SELECT
page_url,
sessions,
AI.GENERATE(
MODEL `project.dataset.gemini_model`,
page_content,
'Funnel stage: awareness, consideration, or decision. Base on content tone, CTA strength, product detail. Return stage only.'
) AS funnel_stage
FROM `project.dataset.landing_pages`
WHERE sessions > 500;
Los equipos de marketing suelen descubrir que destinan la mayor parte del presupuesto pagado al contenido de sensibilización cuando la mayoría de las conversiones se producen en las páginas de la fase de toma de decisiones. Esta consulta hace que las decisiones sobre la reasignación del presupuesto sean obvias.
Si extraes manualmente los datos de las campañas de varias plataformas antes de cargarlos en BigQuery, ese es tu verdadero obstáculo. Dataslayer automatiza las transferencias de datos desde Google Ads, Facebook, LinkedIn, TikTok y más de 50 fuentes más directamente a BigQuery. Una vez que todo esté centralizado, puedes ejecutar estas funciones de IA en todas las campañas en una sola consulta.
6. Extraiga datos estructurados de los resúmenes de la campaña
Si guardas los resúmenes de los clientes como archivos PDF en Cloud Storage, esto elimina horas de búsqueda manual:
SELECT * FROM AI.GENERATE_TABLE(
MODEL `project.dataset.gemini_model`,
TABLE `project.dataset.campaign_brief_pdfs`,
STRUCT(
'Extract: monthly_budget (number), primary_kpi (string), target_age_range (string), target_locations (array).' AS prompt,
'monthly_budget INT64, primary_kpi STRING, target_age_range STRING, target_locations ARRAY<STRING>' AS output_schema
)
);
Ahora puede consultar «qué clientes se dirigen a personas de entre 25 y 34 años con presupuestos superiores a 50 000 dólares» en lugar de abrir docenas de archivos PDF. Útil para la planificación de recursos y la previsión de capacidad.
7. Encuentre brechas en la mensajería de la competencia
El análisis competitivo de los mensajes publicitarios revela oportunidades de posicionamiento:
SELECT
competitor_name,
AI.GENERATE(
MODEL `project.dataset.gemini_model`,
STRING_AGG(ad_headline, ' | '),
'Analyze these headlines. Top 3 messaging themes they emphasize? What angle are they NOT covering?'
) AS messaging_analysis
FROM `project.dataset.competitor_ad_scrapes`
WHERE scrape_date >= CURRENT_DATE() - 30
GROUP BY competitor_name;
Cuando analizas más de 50 anuncios de la competencia y descubres que todos utilizan los mismos 2 o 3 ángulos mientras ignoran los demás, has descubierto posibles oportunidades de diferenciación. Esto funciona especialmente bien en mercados abarrotados.
Lo que esto cuesta realmente
No se necesita una suscripción de IA por separado. Pagas los costos regulares de BigQuery más el uso de la API de Gemini.
He aquí un ejemplo real: el análisis de opiniones de 10 000 reseñas de clientes (200 caracteres de media):
- Entrada: 10 000 × 200 = 2 millones de caracteres = 0,15 USD
- Salida: 10 000 etiquetas × 10 caracteres = 100 000 caracteres = 0,03 USD
- Total: 0,18 USD
Compare eso con la revisión manual de 15 revisiones por hora. Se trata de 667 horas de trabajo como analista. Incluso a 25 dólares/hora, son 16.675 dólares en costes de mano de obra frente a dieciocho céntimos en costes de API.
El Página de precios de BigQuery desglosa la capacidad bajo demanda frente a la reservada. Para conocer los costos específicos de la API de Gemini, consulte Precios de Vertex AI.
Cuatro maneras de mantener bajos los costos
- Agrupa tus consultas: Procesa 1000 filas a la vez en lugar de realizar 1000 llamadas de API individuales
- Filtrar antes de analizar: Utilice las cláusulas WHERE para reducir las filas antes de que se ejecute AI.GENERATE
- Comience con Flash: Gemini 2.0 Flash cuesta un 75% menos que Pro y funciona bien en la mayoría de los casos de uso de marketing
- Divida sus tablas: Consulta solo datos recientes en lugar de procesar todo tu historial cada vez
De Google guía de optimización de costos cubre estrategias adicionales si está procesando volúmenes masivos.
Solución de problemas comunes
Errores de «Permiso denegado» al ejecutar consultas:
Olvidaste conceder la función de usuario de Vertex AI a tu cuenta de servicio de BigQuery. Esa dirección de correo electrónico aparece cuando creas la conexión externa. Cópiala, ve a IAM y Admin y añade el rol. Este es el error de configuración más común.
Consultas que tardan entre 2 y 3 minutos en completarse:
Estás llamando a AI.GENERATE en cada fila en lugar de hacerlo por lotes. Procesa las filas en grupos de 100 a 1000:
-- SLOW: Makes 10,000 API calls
SELECT AI.GENERATE(MODEL m, headline, prompt) FROM ads;
-- FAST: Makes 10 API calls (batches of 1,000)
SELECT
batch_id,
AI.GENERATE(MODEL m, STRING_AGG(headline, ' | '), prompt)
FROM (
SELECT headline, FLOOR(ROW_NUMBER() OVER () / 1000) AS batch_id
FROM ads
)
GROUP BY batch_id;
Obtener formatos de salida inconsistentes:
Si AI.GENERATE devuelve «Alto» algunas veces, «alto» otras veces y «Muy alto» de vez en cuando, cambie a AI.GENERATE_TABLE con esquemas explícitos:
SELECT * FROM AI.GENERATE_TABLE(
MODEL m,
TABLE source,
STRUCT(
'Rate urgency' AS prompt,
'urgency STRING OPTIONS (description="Must be exactly: high, medium, or low")' AS output_schema
)
);
La restricción OPTIONS obliga a Gemini a ceñirse a los valores definidos.
Cuándo usar BigQuery AI en lugar de exportar a ChatGPT
Ambos enfoques tienen su lugar. Aquí te explicamos cuándo usar cada uno:
Usa BigQuery AI cuando:
- Analizar más de 1000 filas (la exportación se vuelve tediosa)
- El análisis debe ejecutarse a diario o semanalmente según un cronograma
- Los datos no pueden salir de BigQuery debido a los requisitos de cumplimiento
- Unir varias tablas antes de ejecutar el análisis
- Las canalizaciones de datos ya llegan a BigQuery
Exporte a ChatGPT o Claude cuando:
- Realizar un análisis único en una muestra pequeña (menos de 500 filas)
- Sigo explorando y descubriendo qué preguntas hacer
- El equipo no escribe SQL
- Probar ideas rápidas antes de convertirlas en consultas automatizadas
- Necesito mostrarle a alguien una prueba de concepto rápida
Para la mayoría de los equipos con canalizaciones de BigQuery establecidas, las funciones de IA tienen más sentido. Eliminan los pasos de exportación manuales, procesan millones de filas en cuestión de minutos y mantienen los datos confidenciales de los clientes donde pertenecen.
Búsqueda semántica con AI.EMBED y AI.SIMILARITY
Más allá de la generación de texto, Google también lanzó AI.EMBED y AI.SIMILARITY. Estas permiten realizar búsquedas semánticas sin crear bases de datos vectoriales personalizadas.
A continuación, te explicamos cómo encontrar campañas similares a las de tu mejor desempeño:
SELECT
campaign_name,
AI.SIMILARITY(
AI.EMBED(MODEL embed_model, campaign_description),
AI.EMBED(MODEL embed_model, 'your best campaign description')
) AS similarity
FROM campaigns
ORDER BY similarity DESC
LIMIT 10;
Esto busca por significado, no solo por palabras clave coincidentes. Una campaña sobre «rebajas de verano» coincidiría con «descuento para climas cálidos», aunque no compartan ninguna palabra. Es útil para averiguar qué campañas históricas son similares a los conceptos nuevos antes de probarlas. Ayuda a predecir el rendimiento antes de comprometer el presupuesto.
Cómo empezar
Elige un caso de uso de esta lista. Empezar por la clasificación del texto de los anuncios o el análisis de opiniones funciona bien. Son sencillos y muestran los resultados de forma inmediata.
Primero ejecútelo en 100-500 filas. Valide los resultados de la IA comprobándolos manualmente para asegurarse de que cumplen con las expectativas. A continuación, amplíelo a su conjunto de datos completo y configúrelo para que se ejecute según un cronograma.
La mayoría de los equipos pierden el tiempo intentando crear el mensaje perfecto desde el primer día. Un mejor enfoque: empieza con clasificaciones simples (opiniones, categorías básicas), aprende qué es lo que Gemini maneja bien con tus datos específicos y, luego, amplía gradualmente a tareas de extracción más complejas.
Pruebe siempre las nuevas instrucciones en muestras pequeñas antes de ejecutarlas en los datos de producción. Y utilice Gemini 2.0 Flash para realizar pruebas. Cuesta mucho menos que el Pro y funciona bien para validar su enfoque.
Esto funciona muy bien para el inglés. Para otros idiomas, el kilometraje puede variar. Realice pruebas exhaustivas con datos de muestra antes de comprometerse con los flujos de trabajo de producción.
Preguntas Frecuentes
¿Necesito saber Python para usar las funciones de IA de BigQuery?
No. Son funciones SQL estándar. Si puedes escribir SELECCIONAR* DE LA TABLA, puede usar AI.GENERATE. El mensaje es solo una cadena de texto dentro de la consulta.
¿Puedo analizar imágenes o vídeos con estas funciones?
Sí. BigQuery admite tablas de objetos que hacen referencia a los archivos almacenados en Cloud Storage. Puedes analizar imágenes de anuncios creativos, extraer momentos clave de vídeos o transcribir archivos de audio, todo ello mediante consultas de SQL.
¿Qué tan precisas son las respuestas de la IA?
Depende de la calidad de su prontitud y de la cantidad de contexto que proporcione. En las tareas de clasificación con indicaciones bien escritas, la precisión suele oscilar entre el 85 y el 95%. Compruebe siempre de forma puntual los resultados de las muestras antes de confiar en los resultados a gran escala. Cuanto más específico sea su mensaje, mejor.
¿Cuál es la diferencia entre AI.GENERATE y AI.GENERATE_TABLE?
AI.GENERATE devuelve un STRUCT (datos estructurados dentro de una columna). AI.GENERATE_TABLE devuelve una tabla completa con las columnas que defina. Usa TABLE cuando necesites varios campos de salida, como «sentimiento», «confidence_score» y «categoría».
¿Sustituye esto la necesidad de contar con analistas de datos?
No. Automatiza las tareas repetitivas de clasificación y extracción, pero sigue siendo necesario que los analistas escriban indicaciones eficaces, interpreten los resultados en el contexto empresarial, detecten problemas de calidad de los datos y diseñen experimentos basados en la información obtenida. Piense en ello como dar a los analistas un apalancamiento 10 veces mayor, no como si los sustituyera.
¿Cuándo estarán disponibles de forma general las funciones de IA gestionadas (AI.IF, AI.SCORE, AI.CLASSIFY)?
Estas funciones se encuentran actualmente en versión preliminar pública a partir de noviembre de 2025. Google aún no ha anunciado una fecha específica para la disponibilidad general, pero las está optimizando de forma activa con planes para mejorar el rendimiento de manera significativa al transferir más procesamiento directamente a BigQuery.
Si sigues exportando datos manualmente a BigQuery antes de ejecutar estos análisis, Dataslayer puede programar transferencias automáticas desde Google Ads, Facebook, LinkedIn, TikTok y más de 50 fuentes más directamente a BigQuery. Pruébalo gratis durante 15 días.


.avif)




