Cómo utilizar GPT4-VISION para EXTRAER INFORMACIÓN de un PDF

Productomania

Просмотров 9 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 26 окт 2024

Комментарии • 33

@productomania 10 месяцев назад ⁺⁴
He grabado también un TUTORIAL de 45 MINUTOS en el que explico PASO A PASO cómo he creado el escenario de MAKE, lo he incluido en el CURSO de AUTOMATIZACIÓN DE PROCESOS con IA: productomania.io/curso-automatizacion
@Sebasdice 10 месяцев назад ⁺⁴
Eres el mas duro en automatización en español. Gracias por tus videos!
@joseguillermocastro4333 10 месяцев назад ⁺¹
Mi canal favorito de IA con ejemplos reales ✌️
@maribelmed 10 месяцев назад
Muchas gracias, era uno de mis vídeos más esperados
@DeIdeaANegocio 10 месяцев назад ⁺¹
Juan te superas con este tipo de contenido, que grande 👏🏼
@futboladicto2239 10 месяцев назад
Muy buena Juan, síguele así yo muy pronto tomaré el curso👍🏻👍🏻
@TICdoc_ 10 месяцев назад ⁺¹
Muy buena herramienta el Make. Imagino que el paso de pdf a imagen para extraer texto o json después, se podría optimizar extrayendo directamente del pdf que no dejan de ser conjuntos de texto, posiblemente dependerá cómo se haya hecho el pdf, será más o menos fácil.
@maynorelias3725 9 месяцев назад
Qué vides tan buenos, suscrito y compartido; más sobre GPTs!! xD
@productomania 9 месяцев назад
Gracias!
@AcademyNoCode 10 месяцев назад
Muy top el canal Juan. Congratzs🎉
@rommelleon9429 Месяц назад
Esta demasiado bueno el video, me gustaria probar el escenario, donde podemos encontrar el escenario para importarlo. Si no es mucha molestia o ya no esta disponible 😕
@javieralvarezgarcia1147 10 месяцев назад
Muy buena!
@fernandoz6329 10 месяцев назад ⁺¹
Muy interesante e ingenioso(y suscripto tambien)! El proceso asume que toda la información del hotel se encuentra en una página? ¿Que sucede si la información de un hotel queda distribuida en 1 o 2 páginas? Se podría consolidar dicha información?
@productomania 9 месяцев назад
En una petición a GPT4-Vision puedes enviarle varias imágenes a analizar, podrías enviarle en cada petición siempre 2 o 3 imágenes para solventar el caso que comentas y después asegurarte de alguna forma que no se añade en GSheets información duplicada.
@braindraw1512 17 дней назад
Buen dia. Como puedo contactarlo para un servicio
@Lgurruchaga04 8 месяцев назад
Juan. Estos esquemas o prompt de sistema, los debes crear desde 0 o desde donde se puede bajar un ejemplo y modificarlo segun la funcion?
@productomania 8 месяцев назад
Hola! Los debes crear desde cero, pero aquí tienes algunos ejemplos que pueden servirte de inspiración: platform.openai.com/examples
@garyjo3229 9 месяцев назад
Una pregunta esa plataforma donde haces la llamada a gpt es ? Make?
@rgarcialobo 5 месяцев назад
Hola Juan! Muchas gracias por tus explicaciones. Quería preguntarte si te sigue funcionando el escenario por el tema de la URL de drive. Yo estoy teniendo problemas al probarlo con gpt-4o
@productomania 5 месяцев назад
Sí, acabo de probar a migrar a gpt-4o y me funciona, ¿qué error te da?
@rgarcialobo 5 месяцев назад
@@productomania No reconoce la imagen y creo que es por la URL, me pasa tanto en Google Drive como en OneDrive. Con ambos me indica esto: [400] You uploaded an unsupported image. Please make sure your image is below 20 MB in size and is of one the following formats: ['png', 'jpeg', 'gif', 'webp']. Es un .png y pesa 51kb.
Sin embargo subí la imagen a firebase y con su URL sin problema.
También lo he realizado subiendo a Cloudinary las imágenes desde make y con la URL también funciona. El problema es que meto más módulos en el camino y otra aplicación más con sus costes asociados.
@productomania 5 месяцев назад
@@rgarcialobo ¿Le estás pasando el 'web content link'? Porque Drive también te devuelve el 'web view link', pero ese no sirve.
@rgarcialobo 5 месяцев назад
@@productomania Este error me da con 'web content link', con 'web view link' me daba otro. Muchas gracias Juan por tu atención!
@mariocamachomolina2372 10 месяцев назад ⁺¹
Cómo puedo acceder a GPT4-visión desde España ?
@ofjdaz 10 месяцев назад
Hola, que pasa si un hotel no tiene la info completa en una pagina? Es suficientemente inteligente como para entender que tiene que esperar la siguiente imagen? Me pareció que no.
@productomania 9 месяцев назад
Buena pregunta. En una misma petición puedes enviarle varias imágenes, podrías enviarle en cada petición siempre la imagen siguiente para resolver ese problema y luego verificar de alguna forma que no añade al GSheets información duplicada.
@EkhyOk 10 месяцев назад ⁺¹
No podemos confiar en chatgpt ni para sacar información tan básica como un folleto de hoteles.
Y vemos que anuncian la ampliación de los contextos pero queda demostrado que es más impreciso todavía con cantidades grandes de información.
@jose.andonaire 10 месяцев назад
Hola Juan, cual seria la mejor forma de poder tener llamadas a la API de OpenAI, pero en la cual se quiera poder limitar a cantidad de tokens, de esa forma poder tener un presupuesto determinado por consulta o por IP de la persona que hace la consulta y no se vaya todo el saldo en ello, ya que yo lo hice con un formato JSON pero identificando por filas dividiendo la data en cierta cantidad de caracteres con un delay hacia adelante y hacia atras para que tenga un contexto mejor, pero a veces no da toda la información relacionada
@cesarcoronel2402 10 месяцев назад ⁺¹
Por qué es mejor pasar el pdf a imágenes para que lo analice, no se puede simplemente pedir que extraiga la información del pdf?
@productomania 9 месяцев назад
La API de GPT4-Vision no admite PDFs, solo imágenes.
@ofjdaz 10 месяцев назад
La otra duda que tengo, puedes guardarlo a una base de datos como mongo? Etc?
@productomania 9 месяцев назад
Sí, Make tiene integración con Mongo: www.make.com/en/integrations/mongodb
@achilledup1121 6 месяцев назад
Yo creo que el tutorial esta interesante pero una persona que nunca a usado make como yo, va muy perdida...

Следующие

Автовоспроизведение

Aprende lo básico sobre APIs y HTTP para CONECTAR la IA con cualquier aplicación