Это видео недоступно.
Сожалеем об этом.
GPT-4o是如何做到低延迟实时对话的?
- Добавить в
- Мой плейлист
- Посмотреть позже
- Поделиться
Поделиться
HTML-код
Размер видео:
- Опубликовано: 15 май 2024
- 为您解读GPT-4o采用了什么网络架构,采用了什么技术来实现低延迟实时对话的。
Комментарии • 9
Следующие
Автовоспроизведение
GPT-4o 背後可能的語音技術猜測Hung-yi Lee
Просмотров 53 тыс.
Two GPT-4os interacting and singingOpenAI
Просмотров 2,9 млн
大模型解决不了英伟达的难题,AI新范式必将出现:专访安克创新CEO阳萌老石谈芯
Просмотров 235 тыс.
Five Nights at Freddy's: Into The Pit - Part 2Markiplier
Просмотров 3 млн
I Played Fortnite Chapter 2LazarBeam
Просмотров 3,5 млн
Why is it so dangerous to step on a rusty nail? - Louise ThwaitesTED-Ed
Просмотров 1,1 млн
Highlights: Springboks v Australia in BrisbaneOfficial Springbok YouTube
Просмотров 191 тыс.
如何使用LangSmith创建测试数据以及对RAG评估AI开发者-就爱瞎鼓捣
Просмотров 830
AI, Machine Learning, Deep Learning and Generative AI ExplainedIBM Technology
Просмотров 56 тыс.
GPT-4o:8 種應用解說、最適合大眾的免費 AI?即時對話、語言學習、學科解題家教|OpenAI 發佈會|雷蒙三十柚智夫妻 X 雷蒙三十
Просмотров 539 тыс.
OpenAI与谷歌多模态重磅更新,生成式AI大战升级第二轮|GPT-4o、Gemini、Project Astra and more硅谷101
Просмотров 253 тыс.
ChatGPT-4o重磅登場,如果一切都是真的,不能再說沒出國學不好英文了 / 現在,好想學英文啊!!!!!!青茶說
Просмотров 589 тыс.
站上AI第一波浪頂後,台灣企業靠什麼繼續贏?feat. 陳良基 - 決策者・聽天下天下雜誌 video
Просмотров 88 тыс.
Rust是AGI超级人工智能的语言吗?(续)WasmEdge 中文
Просмотров 2,9 тыс.
Let's build GPT: from scratch, in code, spelled out.Andrej Karpathy
Просмотров 4,6 млн
Мухочирон эхтиёт бошед!ГОЛОС МИГРАНТА
Просмотров 114 тыс.
Sevinch Ismoilova - Xayollarim 18-Avgust 19:00 PremeraSevinch Ismoilova
Просмотров 228 тыс.
«Кадыров боится позора»: что известно о захвате бойцов «Ахмат» в плен ВСУТелеканал Дождь
Просмотров 1,5 млн
КУДА ДАЛЬШЕ ДВИНУТСЯ ВСУ? БЕСЕДА С ЮРИЙ ФЕДОРОВФЕЙГИН LIVE
Просмотров 522 тыс.
ВОТ ПОЧЕМУ Я ПЕРЕЕХАЛ В ОБЛАСТЬ И БОЛЬШЕ НЕ ВЕРНУСЬ В ГОРОД.AcademeG DailyStream
Просмотров 239 тыс.
Inside Out 2: Does Alexia Treat Joy Kindly? #shorts #animationAnythingAlexia
Просмотров 13 млн
ВРАГ В ШОКЕ! СДЕЛАЛ КД 1 СЕКУНДУ и ВЫНЕС ВСЕХ #blitz #tanksblitz #shortsnYJI9 TV
Просмотров 150 тыс.
Уникальный способ покраски дисков без снятия с машины #automobile #техсоветы #diy #автохитростиПовтори АвтоХак
Просмотров 15 тыс.
AI开发者先AI一步,共学技术交流群,加微信:aixiagudao,或者自己扫码:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
streaming输入这块肯定是,但这还不足以支撑。而且最大的问题是,如果在对话中加入了相反的意思,比如“你先唱首歌吧,哦不,你还是讲个故事吧”这就会导致最初的语音合成是错的,因为没有context。而实际上并没有
“你先唱首歌吧,哦不,你还是讲个故事吧”,大语言模型可以理解你这句话的意思,会把前面的忽略掉。如果中间停顿足够大,它已经开始唱歌了,也是可以将其终止的。
不用管啥架构只要token产生的速度足够快就行
如何解释4o可以唱歌?感觉生成的不只是文字再转语音,而是一次性转成语音?
非常有可能,我没有看到基于LLM的合成的资料,如果有相关的资料欢迎留言反馈。
那么,AI正在输出的时候,当有人打断他的话,它是如何能够进行中止输出快速转为新的任务执行呢?
這太簡單了
直接把原本的session drop掉就好
LLM生成时每个生成一个token都是一次推理,也就是forward操作,所以是可以在任何一个token生成后停止的。