即時翻譯其實應該是一個無解的東西。因為不同的語言的語序是不同的,比如英文會把疑問詞what how do did are等等放在前面,比如How do you do,How do you speak something,只聽前兩個單詞是無法翻譯的。而日文則把否定的ない放在結尾,不聽完就是完全相反的意思了。所以至少要整句聽完才能翻譯,而且日文這種「不精確的語言」需要大量參考上下文才能翻譯,學過日語的過是有會日語的朋友的一定知道我在說什麼。 這些就算交給真正的AI,都是要有一個大的時差才能翻譯得比較理想。大餅AI本質上感覺還算不上純 真AI,它不是像拉克絲說的只是一個指令集,純指令集應該是STT加上語氣、語調等特徵碼。但是實測部分不可被STT的雜音依然會被變聲,那麼也就說明它不是基於STT的文本字元的,它AI的部分應該是用在修音上,而不是字元提取上,那對於翻譯就更困難了。 多年前就有一個可以通過分析提取聲音參數達到高度模仿的變聲器,大概是零幾年的事了。那不是AI,就只是一種特徵提取算法。大餅有AI加持,提取效果好了太多,但從使用體驗上看,它大概還是在做類似的事。要真正達到高度模仿,勢必要直接STT提取原生的講話內容為純文本,再配合參數用TTS重新生成,這樣出來的聲音才是純淨的,完善的,也可以對文字進行更多的處理,比如翻譯、語氣優化、語境轉換、甚至是性格匹配(比如你扮演一個小女孩,那麼她的用詞、尾語一定和一個糙漢子不一樣)之類的。
上一期《2023年的AI語音强到有多離譜?你聽過無數遍的聲音,背後的故事超乎想像!| LKs》:ruclips.net/video/c2NjaX3Ibnw/видео.html
浪迹天涯那个换成LKS的音色后居然普通话都变差了,哈哈哈哈!
哈哈哈哈哈哈哈哈 對不起 後面說唱那個對我來說太搞笑了wwwwww
阿笠博士表示:我的領結…
我也是想到这个😂😂😂
開頭真的被騙到了 以為是用比較破的Mic來錄...
ai换脸,ai换身体,AI变声,进一步压缩女主播生存空间😂😂😂😂
這小拉的聲音真的很小拉
這個CEO說他社恐,但是講話也太順了吧
网络社恐又不一定是现实社恐,网络上也许是个女性人设呢?🤣🤣🤣
請問主播變聲時用的麥克風是哪個牌子呀
啊!录音时候双马尾的是那个up!
怎么想到塑料叉一起做视频啊哈哈哈哈莫名的“破次元”感
github又养活了一家公司...不过至少他没说是自研的技术
无知与偏见。 技术本身就有多个层级,关键是你那个层级是自研的,而不是那块你用了开源的技术。
@@albertsnow7111 沒基底你怎建上層, 事實上基底是最花時間的
github就在那,你的公司呢?
這是哪個項目做的 好想知道
你的公司呢?你怎么做不出来?
牛了B了!这期是网络电话诈骗致富经啊!!! 哈哈哈!!!
诈骗骗不到我这种不喜欢接电话的,尤其陌生号码。
太刑了
以后逗骗子要当心,电话那头很可能只是装傻陪你聊天,实际上在采集你的声纹,国外已经有用模拟人声咋骗的案例了
你也开
以後遠端溝通,只能用彼此暗號確認本人了,音色,影像都不能相信
哈哈哈,乔碧萝殿下😂😂😂
其实真要调的话应该是可以手工把音色、音调、停顿都调得很像真人,但那是另外的价钱
有沒有大佬教一下人在台灣要怎麼註冊呀
完了, 所有印度詐騙口音都沒了.....
哈哈哈哈哈角度独特
突然想到一点,以后很多演员台词不过关,后期配音是不是会找专业配音演员AI换音呢?
想要給客戶即時互動的效果那就燒錢吧
算力很貴的。
總不可能在用戶手機上進行運算
如果連續去聽的話,是聽得出來,畢竟變聲的音色不亮!不過單聽,真能虎到不熟的人!
看题目我的第一反应以为是应用在 杀猪盘。。。
音库的制定确实是挺麻烦的,需要原始音频进行挑选以及进行音素标注以及韵律
请问大神,在哪能找到教程?我用配音演员的声音素材应该能生成他的音库吧?对电脑配置要求高吗?
@@Bang2010 😨...voice actress otaku?BRUH
😂你突然会唱RAP了!!好酷
海外用戶是否無法註冊? 剛剛下載了發現只能從用戶端輸入手機門號才能註冊...輸入海外的手機也無法發送驗證碼:'(
但當連語調情緒都能直接模仿的話詐騙就更難辨識了
前提是詐騙集團要能拿到你的音頻,所以平民百姓應該還好 明星之類的大眾人物比較危險
哦吼,lks的声音说日语好听诶!
可以用自己的聲音是哪一個開源軟件阿
太好了 以后不但能看换脸视频 还能看换声的。女明星们色色发抖。
小派有點小派👍
饒舌超帥
能不能试试用小拉的声音说一句:帮帮我,史瓦罗先生!(doge
哇 喜欢通天塔的想法
有没有手机版本的
即時翻譯其實應該是一個無解的東西。因為不同的語言的語序是不同的,比如英文會把疑問詞what how do did are等等放在前面,比如How do you do,How do you speak something,只聽前兩個單詞是無法翻譯的。而日文則把否定的ない放在結尾,不聽完就是完全相反的意思了。所以至少要整句聽完才能翻譯,而且日文這種「不精確的語言」需要大量參考上下文才能翻譯,學過日語的過是有會日語的朋友的一定知道我在說什麼。
這些就算交給真正的AI,都是要有一個大的時差才能翻譯得比較理想。大餅AI本質上感覺還算不上純 真AI,它不是像拉克絲說的只是一個指令集,純指令集應該是STT加上語氣、語調等特徵碼。但是實測部分不可被STT的雜音依然會被變聲,那麼也就說明它不是基於STT的文本字元的,它AI的部分應該是用在修音上,而不是字元提取上,那對於翻譯就更困難了。
多年前就有一個可以通過分析提取聲音參數達到高度模仿的變聲器,大概是零幾年的事了。那不是AI,就只是一種特徵提取算法。大餅有AI加持,提取效果好了太多,但從使用體驗上看,它大概還是在做類似的事。要真正達到高度模仿,勢必要直接STT提取原生的講話內容為純文本,再配合參數用TTS重新生成,這樣出來的聲音才是純淨的,完善的,也可以對文字進行更多的處理,比如翻譯、語氣優化、語境轉換、甚至是性格匹配(比如你扮演一個小女孩,那麼她的用詞、尾語一定和一個糙漢子不一樣)之類的。
在下載後卻發現需要手機註冊
但又沒有中國的手機號碼
請問有解法嗎
搜索一下虚拟电话
要怎样下载,怎么找不到,只有介绍罢了,找不到下载处。
感觉自己被夺舍了哈哈
挺好用的,就是有个问题吧,下载安装之后,我电脑整个没声了。。。
哪用半小时的人声...最新的论文里5秒钟的声音就足够了,而且基本分辨不出来
泰酷啦
开头我还是听出来了哈哈
拉克絲:我也有«如何征服英俊少男»😂😂😂😂😂😂😂😂😂😂😂😂😂😂😂😂😂
粉絲:???
什麼洨啊 也太強了吧 跟真的一樣
拉導要不要做一期牙套的視頻,很推
这样的产品,我等候已久了
成本都是花在哪里了?
只需大概半小时左右的声库 那明星声优们的声音就更好被提取了吧
有个 AI 孙燕姿
@@StevenMa84 是啊 以后这些在电视媒体经常亮相的明星都会被采样做成音库吧😆
1:25 tm还有doinb😂😂😂😂😂😂
拉基斯😅
善恶是非,实际上只要你心中有善恶、有是非,你心中就有是非,所以,“说是非人”就是“是非者”。对人要真诚,假的才会去除。讲讲这个、讲讲那个,是增长你的智慧,还是增长你的愚痴啊?你现在不讲了,就是有智慧,你再去讲,那你就是增长愚痴。所以,不要去说别人,没有是非,你的心才不会动摇不定;有了是非,你的心就会摇摆不定。
*不针对任何人和 事,仅分享善言,感恩宽容!
高德地圖裡面的聲音都是AI變出來的。。AI變聲說話比唱歌要簡單一些。唱歌的話還要擔心會不會破音
凌志玲的声线 ...
詐騙電話的內容呢😂
实时翻译这个需求量太大了
这个变声属于实用行为,不适合玩。
看到最后,在片尾点了那个“”彩云小梦“”,看完了,我居然找到装了。
还付费了一个月28元,我在那边说说这东西吧!😶
看的我 老头地铁看手机表情都出来了
是不是还有个小爱莉希雅
要不讲解生成式ai对声音领域的影响吧,这俩人说的东西已经有现成产品了
Y有意思
好强
不展望一下诈骗领域么
关键是拉克丝京呛太重。
成本不是问题,会飞速下降
This is so dumb, why did the software usage restricted to only china user? :/
抖音上那些不露脸的 卧槽 被骗了
亚索那里笑死了
那几本书笑死我
iOS 17已經可以用自己聲音做Siri了
安卓系统的很多ui很久之前就有了😂
詐騙...好恐怖...
感觉你很需要换一个新设计的声音,老实说一直受不了你这么装的声音
1月份拍的视频你7月发,攒库存是吧
这不还是效果器么
如果聲音沒有版權,之後歌手失業了
數位知識資產版權從今年開始從此消失
确实 有一定变化 但完全可以误解
這技術有點危險啊感覺~
这个大饼变声 根本要中国电话号码
我们不是中国人的 就别想了
说实话,这个领域商业化有点难,开源项目太多了
視乎情況,畢竟不懂電腦的人是大多數
重點還是要能成為工作流,不是每個企業都需要AI語音。就算開源多,像是剪輯軟體,也是會留下來幾個好用的,而且還需要世界潮流搭上了youtube這個平台
我说开源项目多,不只是说懂点技术的可以自己搞,更是说这个领域门槛低,核心技术没有护城河。如果这个领域市场好,竞争会很激烈。
笑
耗子尾汁
沙发
真不要脸啊,好几万的声库,而别人只花几个小时本地做个模型。压根就不需要10天,就几个小时一个模型全部训练完成。
没有情绪起伏。。。很容易听得出
你去说英文 不同人不同错误一看就知道 特别是学日本说英文 不是变声能掩盖的搞笑 jajaja
AI声音比你好听多了🤣
我艹
gay里gay气
海外没有手机电话号码注册啊