Это видео недоступно.

Сожалеем об этом.

GPT-4o是如何做到低延迟实时对话的？

AI开发者-就爱瞎鼓捣

Просмотров 1,2 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 15 май 2024
为您解读GPT-4o采用了什么网络架构，采用了什么技术来实现低延迟实时对话的。

Комментарии • 9

@techdiylife 3 месяца назад
AI开发者先AI一步，共学技术交流群，加微信：aixiagudao，或者自己扫码：techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
@nullpointer0x0000 3 месяца назад ⁺¹
streaming输入这块肯定是，但这还不足以支撑。而且最大的问题是，如果在对话中加入了相反的意思，比如“你先唱首歌吧，哦不，你还是讲个故事吧”这就会导致最初的语音合成是错的，因为没有context。而实际上并没有
@techdiylife 3 месяца назад
“你先唱首歌吧，哦不，你还是讲个故事吧”，大语言模型可以理解你这句话的意思，会把前面的忽略掉。如果中间停顿足够大，它已经开始唱歌了，也是可以将其终止的。
@k46926472 3 месяца назад
不用管啥架构只要token产生的速度足够快就行
@tryramen 3 месяца назад
如何解释4o可以唱歌？感觉生成的不只是文字再转语音，而是一次性转成语音？
@techdiylife 3 месяца назад
非常有可能，我没有看到基于LLM的合成的资料，如果有相关的资料欢迎留言反馈。
@saibinlin4407 3 месяца назад
那么，AI正在输出的时候，当有人打断他的话，它是如何能够进行中止输出快速转为新的任务执行呢？
@XD-nl1wl 3 месяца назад ⁺¹
這太簡單了
直接把原本的session drop掉就好
@techdiylife 3 месяца назад
LLM生成时每个生成一个token都是一次推理，也就是forward操作，所以是可以在任何一个token生成后停止的。

Следующие

Автовоспроизведение

GPT-4o 背後可能的語音技術猜測

GPT-4o 背後可能的語音技術猜測

Two GPT-4os interacting and singing

Two GPT-4os interacting and singing

大模型解决不了英伟达的难题，AI新范式必将出现：专访安克创新CEO阳萌

大模型解决不了英伟达的难题，AI新范式必将出现：专访安克创新CEO阳萌

Five Nights at Freddy's: Into The Pit - Part 2

Five Nights at Freddy's: Into The Pit - Part 2

I Played Fortnite Chapter 2

I Played Fortnite Chapter 2

Why is it so dangerous to step on a rusty nail? - Louise Thwaites

Why is it so dangerous to step on a rusty nail? - Louise Thwaites

Highlights: Springboks v Australia in Brisbane

Highlights: Springboks v Australia in Brisbane

如何使用LangSmith创建测试数据以及对RAG评估

如何使用LangSmith创建测试数据以及对RAG评估

AI, Machine Learning, Deep Learning and Generative AI Explained

AI, Machine Learning, Deep Learning and Generative AI Explained

【GPT4】GPT-4内部核心技术全揭秘 | 1.8万亿参数 | 16个混合专家MoE模型 | 训练一次超6300万美元 | 训练使用13万亿个token | 推理计算瓶颈 | AI算力 | 工程权衡

【GPT4】GPT-4内部核心技术全揭秘 | 1.8万亿参数 | 16个混合专家MoE模型 | 训练一次超6300万美元 | 训练使用13万亿个token | 推理计算瓶颈 | AI算力 | 工程权衡

GPT-4o：8 種應用解說、最適合大眾的免費 AI？即時對話、語言學習、學科解題家教｜OpenAI 發佈會｜雷蒙三十

GPT-4o：8 種應用解說、最適合大眾的免費 AI？即時對話、語言學習、學科解題家教｜OpenAI 發佈會｜雷蒙三十

OpenAI与谷歌多模态重磅更新，生成式AI大战升级第二轮｜GPT-4o、Gemini、Project Astra and more

OpenAI与谷歌多模态重磅更新，生成式AI大战升级第二轮｜GPT-4o、Gemini、Project Astra and more

ChatGPT-4o重磅登場，如果一切都是真的，不能再說沒出國學不好英文了 / 現在，好想學英文啊!!!!!!

ChatGPT-4o重磅登場，如果一切都是真的，不能再說沒出國學不好英文了 / 現在，好想學英文啊!!!!!!

站上AI第一波浪頂後，台灣企業靠什麼繼續贏？feat. 陳良基 - 決策者・聽天下

站上AI第一波浪頂後，台灣企業靠什麼繼續贏？feat. 陳良基 - 決策者・聽天下

Rust是AGI超级人工智能的语言吗？（续）

Rust是AGI超级人工智能的语言吗？（续）

Let's build GPT: from scratch, in code, spelled out.

Let's build GPT: from scratch, in code, spelled out.

Мухочирон эхтиёт бошед!

Мухочирон эхтиёт бошед!

Sevinch Ismoilova - Xayollarim 18-Avgust 19:00 Premera

Sevinch Ismoilova - Xayollarim 18-Avgust 19:00 Premera

«Кадыров боится позора»: что известно о захвате бойцов «Ахмат» в плен ВСУ

«Кадыров боится позора»: что известно о захвате бойцов «Ахмат» в плен ВСУ

КУДА ДАЛЬШЕ ДВИНУТСЯ ВСУ? БЕСЕДА С ЮРИЙ ФЕДОРОВ

КУДА ДАЛЬШЕ ДВИНУТСЯ ВСУ? БЕСЕДА С ЮРИЙ ФЕДОРОВ

ВОТ ПОЧЕМУ Я ПЕРЕЕХАЛ В ОБЛАСТЬ И БОЛЬШЕ НЕ ВЕРНУСЬ В ГОРОД.

ВОТ ПОЧЕМУ Я ПЕРЕЕХАЛ В ОБЛАСТЬ И БОЛЬШЕ НЕ ВЕРНУСЬ В ГОРОД.

Inside Out 2: Does Alexia Treat Joy Kindly? #shorts #animation

Inside Out 2: Does Alexia Treat Joy Kindly? #shorts #animation

ВРАГ В ШОКЕ! СДЕЛАЛ КД 1 СЕКУНДУ и ВЫНЕС ВСЕХ #blitz #tanksblitz #shorts

ВРАГ В ШОКЕ! СДЕЛАЛ КД 1 СЕКУНДУ и ВЫНЕС ВСЕХ #blitz #tanksblitz #shorts

Уникальный способ покраски дисков без снятия с машины #automobile #техсоветы #diy #автохитрости

Уникальный способ покраски дисков без снятия с машины #automobile #техсоветы #diy #автохитрости