Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
當初柯潔也說AlphaGo贏不了我😂
AI最强大的地方不在于它现在能实现多么好的效果,而在于机器的进化速度远远超过人类,明年,或者十年之后,AI会更加让人感到惊艳
这属于悖论,问题是机器发展太快之后人类根本理解不了。就拿围棋来说,alpha go对人类的棋艺理论没有任何指导作用。你根本看不懂机器在搞啥。。。
技术奇点爆炸😂不用半年就刷新一轮认知
什麼明天十年,現在AI訓練是幾個月會換代升級了人類快逃吧,這領域沒有人類謀生的合理利潤了
按照AI学习的速度和芯片的革新用不上10年
@@waffenss1234567 其實不需要月了,目前一個月內可以做到可以迭代。人類的利潤在於你有沒有能力接受跟學習它,現在要逃避不學習的未來就魯上加魯
现在AI发展方向有点奇怪,本来想AI帮我们洗碗扫地做家务,我们就可以有空去写诗画画做音乐,现在AI开始写诗画画做音乐,而我们还在洗碗扫地做家务……
對!有沒有搞錯啊!
most underrated comment.
ai肯定是从智力活动到体力活动发展的。智力活动只要算力,体力活动不仅要算力还要配套硬件
你知道原因嗎?我怕說出來會得罪到很多人,但是我還是說一嘴好了現在的AI非常仰賴大數據這東西,但是大數據不會天上掉下來,這時候哪邊有人類智慧結晶的大海?沒錯就是互聯網上,且還是免費的呢一台機器人要學習現實生活中的家務事有多困難,我想不用贅述,你首先要把機體做出來然後在沒有辦法加速時間的情況下看它跌倒個好幾年,慢慢才學會站起來但是語言還是繪圖的AI,全都是使用虛擬的數據,這類數據不只是免費的且還可以靠算力加快速度,變得異常簡單在現實當中AI學習行為難以使用生成式對抗網路(GAN) 的方式,你只會看到兩個機器人都在跌倒更別說一個要去絆倒另一隻機器人,不現實但是虛擬數據靠演算法卻可以形成生成式對抗網路(GAN)的方式來掛機等結果,這完全就是省力的作法,還能靠算力去縮短時間,何樂不為?因此你現在看到的AI就是利用全世界人類在互聯網上的足跡,使其達成許多人認為的"想要取代這些互聯網上的創作"這件事用數學觀念想一下吧,會有什麼問題?
哈哈哈,您老牛
没关系,这一版你看不起我😂,下一版虐死你😊
那还真还不一定,也有可能还要十年
@@feifeishuishui V1~V3只用一年時間,根本不用到10年那麼久
@@_gameronin9002 机器学习又不是什么新东西,几十年前大家就觉得希望就在前方,跟你现在差不多的思路,结果ne,已经错了几十年了
@@feifeishuishui 幾十年前是有概念沒有硬件跟數據支持,如今的硬件發展越來越快,數據收集的規模也越來越廣泛,不然為何自從ChatGPT一出名後AI產業會如雨後春筍般一直冒出來?科技的發展只會越來越快,用過去的十年跟現在的十年相比會差很多,所以我才會說不用十年那麼久就能出一個連音樂人都覺得有威脅的,但也要看對方願不願意出
@@_gameronin9002 你先要证明作曲和其他问题需要的硬件是同一个量级。你能证明吗,还是想当然拍脑袋?我看你也不是做科研的,也许科研的思维方式对你来说很难理解
作为一个独立音乐人 我对sona的使用评价: 超过80%的 歌曲质量 歌曲稍微加点流量加持是能火的 这已经满足商业价值了😢😢😢
叨叨结尾所说的很多“需要”,我觉得要达到要求,需要有两点,第一是有足够的训练数据,第二是要有相对完整合理的prompt提示词。叨叨在本集视频里演示的生成,提示词略微有些弱,如果再加入更多细节,比如扩充到一百字以上的描述,生成的结果会好很多。也可以听一下生成榜单上歌曲,学习一下别人的提示词
而且他老人家只生成一对儿就拿出来评价,没有任何说服力。
@@biotester 是的,写提示词prompt也是一项非常专业的技能,需要一定时间的学习和练习迭代才能掌握。我相信以叨叨这样的学习能力,如果能达到100小时以上的prompt写作经验,再加上其对于音乐的理解,一定能得到非常多惊艳的作品。
今天无事用suno生成了几个前奏曲与赋格,虽然不一定“惊艳”,但是听着很像那个意思。我猜冯老师还是没有使用正确的prompts,或者没有生成足够多的样本。不断尝试是作曲的一部分。@@knowknowhow
我觉得AI想代替职业作曲家还早得很,但是干掉一批一天10首歌的抖音神曲写手,还是绰绰有余的
那你还真是低估那些抖音烂口水了,那帮音乐人就目前看可比AI更懂得大众群体听众。你甭管那些歌烂成啥样,架不住听得人多,AI可做不到这一点
@@Valen2CN話是這麼說,可是打數法則,AI一天生個幾千首,總有幾首、甚至幾十首可以做到特別洗腦
不會的,以後抖音會有一堆AI生成的東西,幹掉一批是不會,因為他們也能使用AI
還好周杰倫沒有出在這個時代,不然真的直接被取代掉
那可真是太好了
能到这个水平应用场景就很多了,比如自己拍的短视频配乐,给网络小说配个主题曲,插曲,种种对音乐要求不是特别高的场景,AI水平上短期肯定达不到专业人类的水平,但是它会扩展出几乎无限的应用场景,以前拍视频得用专业的摄像机,普通人用都不会用,更别说剪辑配音了,现在随便谁都可以拍视频配乐了,水平肯定不如专业人员,但是成本低啊,海量的数量里肯定会涌现精彩的作品。
大師也許不會被取代 但產業金字塔中下層的大量被取代掉但是大師會老會死,而且大師也從中下層練功累積經驗技術,才成為大師.產業沒有中下層的生存空間時,以後大師也會絕種.而且你大師再怎麼掙扎,你掙扎時的努力,都是AI訓練進化的養分. 因為你的掙扎反抗,導致AI更有能力取代人類產業未來路線已定,我們不需要騙自己,現實就是這麼殘酷
叨叨可以看一下prompt engineering(提示工程), 总的来讲我觉得给AI好的提词比一般的提词得到的效果相差巨大。我喜欢你的节目,但是我觉得你给SUNO的提词还有很大改进空间.
叨博大概以为字少点的要求比较简单,正好理解反了。对agi而言,描述越清晰(字多点)任务更简单,字少的反而难。
从演示的效果来看,很明显就是这个模型学习的训练数据不足,模型收敛也有问题。本质上AI模型是根据大量的参数权重,去拟合出来一些概率,视频里明显就是处理自然语言问题的时候,没有理解交响乐,只是把“交响乐”输入模型,模型给出来的是钢琴概率很大,然后后面的音乐模型就去做钢琴的生成了。整体上感觉这个模型的结构还是没啥问题的,只是在于训练不足。毕竟Suno AI不太可能像OpenAI那样烧掉海量的资金去专门针对作曲来组织训练数据,然后训练模型、调整参数。但是千万不要小看AI,AI厉害的地方在于总结出来一种数学范式,按照这个范式可以很容易的实现自然语言理解+各种类型的生成(图片、视频、音乐、文字等),范式是固定的,只要不断的提高训练量,就会朝着既定的目标不断收敛,最终量足够大,就会产生类似“量变引起质变”的效果。只要有人愿意烧钱,把从古到今所有的音乐作品按照数字格式进行整理,拿去训练模型,不断调优,那么最终产生的效果肯定是惊人的。关于创新,特定到音乐领域的创新,从模型的视角来看,我觉得可以分成2种,一种是从已经有的音乐里融会贯通,进行组合式的创新,比如把不同的民族特色音乐+西方音乐乐理,产生新的音乐形式。另外一种就是完全从0到1。前一种AI模型很容易做到,后面一种目前看来还是只能靠人。
纯猜测,这个训练数据很难做到足够,训练一个稳定的机器视觉的行人识别需要的数据量可能就比整个巴洛克时期的谱子加起来都大了,学到的特征其实也就那么几个
@@wodddj 训练量是可以足够的。因为可以利用生成式AI来生成音乐让AI来学习。 虽然挺起来很扯,一开始科学家也这样认为,但是确实有效。 特斯拉就是这样做的,否则特斯拉也不够足够训练样本给AI训练。 这个AI 主要就是不够钱同时不够足够好的人才。
你對AI的認知也有缺陷,你說的是AI當中的泛化性跟擬合性,這個是天秤的兩端點,泛化性越高的AI他對於針對單一性的認知就不足,反之,過擬合的結果就是等於大數據,但因為不存在AI能夠擬合到還原大數據,必定存在隨機性,因此會有所謂的LOSS值,這個LOSS值最終會很接近沒錯,但是他會到一個程度後收斂至終點,而這個終點距離標準答案還有很大一段距離。你說量變引起質變,我的解讀是GPT語言模型利用參數的堆疊最終在一個複雜的問題當中透過黑盒子函式的交互"感染"下得到更具有"全局觀"的回答,我沒說錯吧?但問題是,創作本身就是很個人的,在AI的理解當中去看人類創作的大數據會發現光是定義"終點"這件事都充滿矛盾且難以有高度的正相關,這時候很多搞AI訓練的程式員就會為了證明該AI可以用這套方式運作,自己成為了定義"終點"的老師,這也是為何同一份模型越訓練越會成為某一個小群體,這就是擬合過程,擬合到一個程度後,這個AI模型就會失去泛化性,在應用過程當中對於某方面做得異常的好,而另一方面異常的糟糕,很多AI公司發表成果都只拿出某方向過擬合的產物,而給人造成一種AI什麼事情都做得好的錯覺,這種倖存者偏差在統計學領域也是時常見到過,AI就是一種統計學當中常態分布的計算機而已,一個完全靠相關性逆推因果的機器。有一個有趣的東西,你所使用的所有數字密碼,都在現在已經解開的圓周率小數點後面的某一處可以找到,這代表你的密碼已經被破解了嗎?並不是,而是撞庫行為造成的偶然性,在足夠龐大的隨機當中人類的一切都可以剛好被解出來一段,但那並不代表這串數據是有意義的意義是什麼?AI在生成過程當中,它無法給它生成的內容下定義,唯一能做的只有你自己,你給他滿分對它來說也沒意義,因為你正在使用它的輸出功能而不是訓練過程,它唯一做的就是在擬合的過程當中如何的讓你剛好去定義它的產物是"好的",這件事。判斷好壞不是AI做的事情而是使用者作的,因此普羅大眾只要無法分辨它不好,那麼就能在AI公司商用過程當中運作。人類創作的資訊是意識的展現不是撞庫出來的,即便一座山長得像佛我們也可判斷這是自然沖刷力而不是人類雕刻的為什麼人類可以分辨是否為人造物?因為理解物理法則,知道大自然的能力極限在那邊,人類利用工具可以做出更精緻的產品即便是一塊石頭,不管花上幾億年的沖刷也不會成為芯片,因為人類文明的創作是高度意識的,AI學不來,即使適用相關理論也歸納不出來圖片AI生成幾億張圖片也不會出現一個你過往的愛人,最多就是你誤以為是愛人而已。
@@achillesarmstrong9639 你說的是對抗GAN訓練方式吧?這招不怎有效,但是很省人力,主要出在你開著電腦給他跑就好了,最後他會擬合出結果,當然都不會是你要的那樣,但你可以一直掛機讓它跑,跑到你驗證結果覺得....還堪用吧你就發表出去,看看其他人買不買單,不買單就繼續換點參數在繼續跑我說真的搞AI模型訓練根本不用什麼技術力,要的是算力夠,剩下的就是花時間等待而已,智商?
感觉AI如果有自我意识的话 就可以达成从零到一
我記得它的敘述有說盡量以樂曲風格,而不要使用藝術家或歌手名稱作為描述方式,因為他不太認得名字
巧遇
目前版本模型最大的問題在於SUNO團隊太有良心了,因為他們輸入訓練的內容就官方表示都是自己作曲去訓練的,以至於很多古典的資料量不足,而曲風也更偏流行泛用.如果今天他能有跟google或是open AI一樣的大數據來支撐,估計這個影片遇到的很多問題都不會有.目前很多AI功能拉垮的原因不在於技術本身不行,而是各個AI領域及企業之間設定的門閥因為商業利益沒法整併功能,比如Chatgpt或Pi的自然語言模型及數據如果能跟SUNO整併,估計不會有你要他寫賦格結果出現的是只是它資料中盡可能接近的亂七八糟東西.以目前能夠提供文字及大致結構就能產出一首對大眾而言能聽的東西已經是相當大突破了.當初midjourney也是一樣,大家吐槽她手指問題或是畫風明顯ai感,到現在很多照片你甚至要放大倍率去細看分辨到底哪個細節是人類繪畫痕跡哪個是ai生成的軌跡.附上一首自己玩得很開心的歌,用過去寫的詩生成出來的音樂,不考慮細節整體還蠻好聽.ruclips.net/video/nxIvO8NNDRI/видео.htmlfeature=shared
midjourney當初就是有良心的那一個,後來SD盜圖AI出來就把它輾過去了
先不提到底叨叨的提詞寫的好不好,畢竟就是一個一般人寫的水平,不需要也不必太精就,但叨叨的音樂素養是學院等級的,他評判音樂性跟結構是絕對比大部分人要專業的多,就算提詞不夠精進,但評判音樂也夠了。
直接用Song Description的話AI經常會分不清楚哪些是提示詞、哪些是你要的歌詞建議點開上面的Custom Mode試試可以把歌詞跟提示詞分開來描述會比較精準一些至於提到音樂家名字我試過寫"像某樂團的歌"會直接拒絕生成不確定古典音樂家是否有某些保護機制而故意做不像
對,可以試試custom mode
我沒遇到拒絕生成,會拒絕大多是你額度用完了,只要你要求它生成最多就是給你很不像的東西我好幾次生成出來連唱準字都唱不好,它的隨機性還是很高的關於你說很像某樂團的歌,曲風當中最具代表性的就一定能骰到該樂團的曲風,所謂的樂團它的理解是風格,而SUNO對於風格的TAG非常細,你可以寫上十幾二十個都能,包括註明語言如Chinese vocal、Famale vocal等
@@user-E04SU3XL3G 不是額度的問題,我是直接寫song like Metellica他會顯示描述包含藝術家名稱而拒絕生成而且不會扣除額度試過好幾個當代樂團都是一樣的情形
快了 各行各业只有顶尖人士可以幸存
不是頂尖 依照博主說法 AI目前只能拿3分 問題只有3分的人類根本不可能在這個行業混下去
哈哈视频白看了,别在这儿散播谣言和焦虑了。
suno帶給我的是讓我玩一陣子後,我又回去練鋼琴了,激起我的創作欲,當然suno本身產生的東西幾乎無法修改,所以我去購買音樂製作軟體去抓感覺還是比較靠譜的。
Suno的強項是寫各種風格的詞曲。如果你去檢視它裡頭的範例並加以模仿,會發現其實挺強的。最近還有一款更強的AI作曲工具Sonauto ,寫歌寫曲都更勝Suno 一籌,而且完全無限制免費,只可惜目前無法寫出中文歌。
I write lyhrichs in chatGpt, and musicstyle also, than with suno create
叨叨可以考虑再录一期. 试着去从那些拥有最多数据量的音乐领域来考察 suno . 看其再得到充分训练数据量时的表现. 并且我觉得 suno 或其他的音乐生成式AI下一步应该从扩展训练数据和专业音乐从业人员的fine-tuning 入手来改善生成质量. 听了好多叨叨的视频虽然我其实根本听不懂. 但还是很喜欢. 让我这个门外汉知道原来音乐是这么的有规律可循而不是一时的灵感和创意. AI训练数据集除了使用互联网中的音乐推荐标签. 恰就是需要叨叨这种能分析音乐背后逻辑的人来为训练提供数据支持. 来使大语言模型不单单从非专业的听歌人那里获得简单的喜好标签和音乐类型标签. 也从专业音乐人那里获得乐理和其他一些更专业的数据.
这种通用型大模型最大的问题就是,它不为专业考虑。通用二字反而成了这种大模型最大的一个限制。
主要问题是单个标签的数据量是严重不足的,比如我要训练它写technical death metal,你也不知道它是学会了还是overfit了
@@wodddj 对啊,专业人员的量也不够,没办法提供这种专门的调教
这期必须点赞👍!❤ 因为我全听懂了!😂
稍微有点想反驳一下评论区关于提示词的说法。确实,目前的AI,准确的提示词,甚至可以互动的提示,对结果影响很大。但是很多基本的问题仍然需要AI能在没有多余提示词的情况下回答。比如“两声部赋格”、“贝多芬风格的曲子”,这些不应该需要更多提示词。当然也许叨叨可以试试,比如,“写一段两声部赋格,只有一个主题,高音区先出现主题,此时低音声部别出声。第一声部主题结束之后Blablabla,然后第二声部进入并且演奏主题。主题请至少有10个音符,至多50个音符,最短2秒,最长5秒。该主题在每个声部当中至少出现10次,占各声部总时长至少5%“。但是我觉得,即便这样(几乎是在教AI),其效果大概也会差不多。而且假如我问AI,1+1等于几,还要加”想想1个苹果又添了一个苹果是几个苹果,桌上有一个梨我又放了一个梨那现在桌上有几个梨“这样的提示,那这AI实在是够糟糕的。至于发展潜力,希望它能解决更多的问题吧。但是像另外几个评论所说,到目前为止,没有哪个AI不依赖大数据。那么比如让它写赋格,人类现在写出来的赋格有多少首?巴赫所有作品也就上千,后人写的赋格恐怕更少,而制造这种训练数据恐怕不会很便宜。P.S.: 其实我觉得13:03那段有点门德尔松的风格哈哈哈。
等你出这个话题的内容等很久了😋
我用了一下 试了很多乐风rap country rock jazz classic等等 感觉下来就是比较匠气,可以很快的出一首入门以上的音乐。之所以很惊艳一是因为作曲作词速度很快,二是预期低,三是听了太多抖音神曲发现这水平已经不低于完全没门槛的抖音神曲了。想让他做更好的方式其实是更详细的描述而且是用英文,这就意味着你自己还是要懂音乐还要懂prompt 但水平也很难到正经从业者的水平。。所以目前来说还是玩乐用
音乐其实比美术更有科学骨架,正是AI很适合创作音乐的基础。很喜欢叨叨的节目,你的频道本就是拆解音乐的科学逻辑,但这期有些欺负当前AI的感觉。 1. 首先prompt给的好不好是决定AI作品的关键因素,而且跟出图一样,原本就是高速出海量作品里面去淘金,而不指望必出精品。 可以看出叨叨不是那种玩电子作曲的GEEK,可以看看一些音乐软件主播如何结合其他软件去发挥AI的潜力2. 很多人都提到了,它需要的只是更多更全的训练集,跟一些时间3. 它冲击不到叨叨这种正经科班的交响乐成员,但假如叨叨开个工作室给广告电影写歌的话,你原先招十个人可能以后只需要一个了:)
我同意音乐其实更有迹可循。 如果好好训练一个大模型,应该可以做出好的曲子。 但问题是,训练大模型要花很多钱的,谁来买单呢?
我觉得还是因为音乐包含的信息量更少,哪怕20种不同乐器,包含10个八度的所有音,也没有多复杂。哪怕结合人声,也可以直接从波形提取样本点来分析
从 AI 画画的进展速度来看,我觉得音乐也快了。叨叨, 别着急。可能过不了太久。 只要能够数字化的东西,AI 都可以学习和演进。 而且我觉得 AI 可能会采用强化学习的方式,自己作曲,自己打分,自己提升。 就和 Alphago下围棋类似。
我用了 SUNO 一個星期左右 , 我認為 AI 五年來都沒可能取代作曲家和填詞人 ...... 原因 : (1) AI 不懂得將歌曲中段變奏 , 比如 INTRO 以「平和」開始 , 中段想變 ROCK , AI 不一定能「派」得到合適「選段」給你 , 你可能要捨棄 10 多 20 個「樣版」才好運地得到「合用」的。(2) 音樂「造句」不完美 , 以普通話創作相對容易 , 英文相對難 , 派出來的 AI 段 , 有時有點怪怪的 , 不容易「一聽就會唱」........ (3) 你不能完全掌握「編曲」, 本來想要電結他作主角 , 派出來的 DEMO 就變了琴鍵為主角 , 想要日色搖擺 , 就變了美式 POP =.=(4) AI 歌詞比較直接 , 不會有隱喻功效 , 例字 : 在我的作品中 , 有一句 : 我沒有超能力 不能飛越壞天氣 , 但時間和空間靠科技打破距離 ....... 是比喻「互聯網」, 這種句子 , AL 「暫時」還沒趕得上這種文藝水平 ......(5) AI 不太懂替歌曲結尾 , 很多時不能「首尾呼應」(6) AI 不能跟真樂手相比 , 有時有些歌曲 , 有些「空位」本來該是來一段電結他 / BASS SOLO 間奏 , 可是 AI 平淡的「奏過」, 感覺像吃日式咖哩豬扒飯 , 卻沒了豬扒 ...... (喜歡音樂的一定明白)(7) 不懂男女對唱 / 女女對唱 ....... 不懂分工 : A 段由 A 唱 B 段由 B 唱 , C段 A+B 一起唱 =.=(8) AI 派出來的段落 , 還是要花不少時間修改歌詞 , 再重造 , 再修 , 再重造 ...... 做一首3分鐘左右的歌 , 我通常要花三幾小時才能得到滿意(不是完美)作品 .......利申 : 我不是音樂人 , 只是音樂迷 =.=
就连专业人士使用目前最好最专业的VSTi编曲,遇到solo都是要 制作 好久的,还不包括创作,就是制作成符合要求的演奏,都十分困难。如果说suno能底层上解决这个问题,他就算不以AI作曲为产品,光是为编曲人士提供 如此简便的 以假乱真的乐器solo的vsti甚至是offline audio generator,都已经可以 狂卖 来替代现有产品!综上所述,可想而知,在不能解决自行演奏乐器的能力下,要弹作曲,还是先继续卖广告去吧
其实可以之后发展不一定要生成整歌,也可以像copilot一样嵌入音乐制作软件里,像AI绘画被诟病的最多的一点就是不分图层所以没法修改,也就没法嵌入到画师的工作流程里,但AI编曲可以生成MIDI文件,MIDI文件就能在作曲软件里修改了,就可以加入到工作流里
AI未来会以廉价的方式满足很多人的感官需求,也会让人更快速地从感官的刺激里感到厌倦,倒逼出全新的生活方式。可能是向外寻找新的艺术,或者走向复古,或者向内心求索什么是真正的满足感和人生的价值。这种技术会是我们这个时代的人类的课题,机会或者挑战。冯老师这一期我觉得很有意义。
感谢分享,观点分明,举例充分,有说服力。但也不能低估ai的可塑性和成长性,对于有确定性规则的问题,不论规则多复杂,ai必将超越人类。博主关于交响乐、创意上ai很难学习的观点,我持保留意见,规则更开放偏主观,评价标准难以量化上
可能是训练的时候主要用了流行音乐,其他类型的音乐只要下一步多给点数据应该也能做的更好
这就是AI到网上去自己扒下来的吧。因为这种训练需要大量的数据,靠人类去打标签去分类,根本就不现实。人类对文字还可以提供某种监督,因为大家都是识字的。你只要愿意找足够的人来做打标签的事,或者是来做打分的事,都是可以做到的,但是对音乐就不行了。你找不到那么多懂音乐的人去监督AI学习。
@@wujingping不可能让ai自己去网上扒的。爬虫这么简单的东西不需要ai,手写一个就行了。这种 model 需要的数据基本上也不需要打标签,现在很少有监督学习的generative model 了。
@@notepadpowersnail1860 训练素材都是扒下来的
ai强项是学习能力强,冯老师您这种只给一两句简单的描述,希望ai能给出您满意的结果,不是不行,而是ai也需要学习您。如果您有一个ai一直在用,他了解了你,然后你通过他再去调用其他ai,那我觉得结果您应该满意。
他或许现在还看不上这些工具,但有一天他会离不开AI,不会太久的至少他这代人一定会看到
看了一半先评论,我觉得应该是训练数据全都是流行音乐,所以写啥都是流行味
可以选不同风格
能胜任很多背景音乐的创作了。
AI的可怕之处在于进化速度。一个人需要经过多久的训练才能达到目前Suno的水平?接下来一年时间内还能提高多少?而AI在未来一年时间内能提高多少?雇佣一个能达到目前Suno的人写一首平平无奇的曲子需要多少钱?如果把时间成本和沟通成本也算进去的话,比AI高多少?另一个让人沮丧的事实是,多少人具备分辨好的音乐作品和平平无奇的作品差别的能力,并且愿意为这个差别而付费?在大多数场合下,即便是目前Suno的水平就已经绰绰有余了。
你說的沒錯 但現實是你根本不會想僱用一個水平跟Suno一樣的人類 甚至這位和Suno同等級的人類應該需要付費上班 那麼 Suno有付費給你嗎?
挑剔AI的過程中⋯也要留意他們可是在1分鐘之內就做出來,這才是可怕的地方
刚好前两天和同事聊起来这个就把聊天时的一些想法写在这儿吧. 现在的多模态大语言模型既非语言对语言的内容生成. 或者更直接点说使用语言描述生成图片,音频, 视频等生成式大语言模型. 最关键的是训练数据量. 其实这几年随着互联网音乐服务的不断成熟. 大量的音乐被用户们所标记. 这样就天然的为训练提供了基础. 这正是大语言模型突破点所在. 从这个视频其实也可以看出这点. 叨叨如果询问一些互联网音乐中被大家标记的越多的音乐类型其生成结果就越好. 是由其训练数据所决定的. 和几年前的想法完全不同. 几年前我认为 AI 的革命会首先替代那些简单的非创造性的工作. 而如今看来恰是那些原来被我们人类引以为傲的行业更容易被替代. 甚至那些高度依赖于创造力和知识性的行业. 如果给予充分的训练数据和计算资源我相信在特定的音乐领域生成式AI很快会达到或超过人类. 音乐领域决定于其领域的数据量与标记量. 别忘了从不会围棋到超过所有人类棋手AI仅用了不到2年的时间. 那时的资源和算力远不是今日可比的. 在未来5-10年虽然不会所有的从业者都失业. 但会极大的可能性颠覆整个行业. 即便最顶尖的音乐创作者可能也会反过来从AI生成音乐中获取灵感. 而一些从业者(60%-80%)可能真的会失业. 不单单是音乐. 像是插画师, 视频编辑, 律师, 家庭医生, 教师, 程序员等等行业. 其中优秀的人可能会更优秀通过AI获得更大的能力. 而这行业的普通人可能真的就会被AI所替代....
因为这帮搞人工智能的人野心太大了,他们总是想搞一个通用大模型。这也就导致了他们不肯去专门为某个小分类做特化训练,你如果这么干的话,那还叫什么通用啊?所以你会发现,AI有很多bug始终补不上。因为与其花这个死功夫去补这些小bug,还不如开辟新领域。做完了生成文字就去做生成图片,做完图片就去做生视频,做完视频就去做音乐。谁有功夫给你补BUG啊?
問題是,現在又有多少個所謂的音樂人能寫出好聽的賦格曲子?音樂和數學有關,AI要做到也不難吧。
应该是train它的训练集还不够丰富,假以时日,现在的训练集可能多是流行歌曲比较多。不过这也看到一个前景就是音乐专业从业者也可以投身AI领域去更好的发展不同领域的AI。
冯老师对AI能力评价到位🎉!同时,我是觉得,AI软件公司缺少冯老师水平的艺术指导,给AI学习的内容不足,造成现在AI的创作缺陷。伊,冯老师的机会来了,嘻嘻
这你可说错了,AI比你的冯老师强太多了,这个v3就已经碾压了你的冯老师,因为你的冯老师只熟悉几种音乐风格,几种乐器而已。
不可能,做音乐的AI能没有业内指导?
如果按目前圖畫照片生成AI的軌跡來看要凸顯怎樣的特色、特色要用什麼類型,是需要生成者來給予越要在特色中別具創意,也越需要生成者提供細節要越多更具體的『要求指定』,生成者也需要具備更多AI軟體中提供的各種功能工具(處理各式各樣狀態的輔助工具)也就是生成者如果給出越少的訊息,那AI出來的成果就是抽卡,時好時壞,抽到生成者滿意為止但如果生成者有越多的要求,那生成者就像是草圖或是概念構思者,AI就會扮演『完稿者』的角色在繪圖生成的領域,AI 善於『風格延伸應用』與『融合不同風格於一幅圖』的能力人類要想像同一風格延伸到不同題材、主題的創作或是要將不同的風格合理的融會在一起,產生視覺新鮮感這兩者要達到協調感,都是不容易的例如『水墨寫意風格的寫實感畫作』,可能看得人會覺得這描述是什麼鬼啊,但AI就是有辦法所以未來音樂方面的AI,我想也會達到這樣途徑的一天到時候可玩性應該會比現在更多
要失業的何止是音樂人?(攝影,作家,醫生,老師,....)
这个挺有启发,说明AI模型测试最重要的还是subject matter expert。比如钢琴那段,一般人是不会了解赋格的定义的,所以怎么定义模型的性能是非常需要行业背景的。当然说到底,可能还是古典音乐的电子素材比较少(也就是把手写的谱子转化为电脑文件格式的谱子),所以模型没怎么见过这种音乐形式。凡是古典音乐范畴全部被模型理解为浪漫主义钢琴曲,可能这种形式的古典音乐电子素材比较多。
SunoAi 現階段搞個流行樂或者伴奏還可以。做個Demo平日玩玩還是很好的😂
我来从专业的角度来说一说我的看法,其实赋格作品的要求对于ai来说不是什么问题,我认为唯一的问题就是时间问题,因为无论和声和对位,模仿,包括扩充,反向进行等等都相对有据可查,如果让100位具有复调音乐作曲经验的人去训练这个模型去专门创作巴洛克时期的作品,我相信它能完成,但它不能完成的是创新!它只能基于目前已有的理论下进行创作,但其实这已经很厉害了,但绝对不够!单凭这一点它就永远落后于人类,还有我一直在考虑的是,怎样让ai认知美学,针对不同审美的听众制定音乐,说白了就是什么样的作品适合什么样的人,例如我就喜欢多声部的逻辑感,有的人就喜欢理查德,还有就喜欢死亡金属的,所以这个领域值得探讨的内容太多了,ai做到今天这个地步,或许在作曲领域已经是这些理科生们的极限了,再往下只能依靠我们阳春白雪的文科生了,毕竟你计算机专业的人根本就不懂音乐,因为你不懂音乐美学!
创造力应该不是凭空的, 创造力是先学习后创作, AI感觉好像走得就是人的路。 一个人听曲子学习的时间是有限的, 但是这些GPU们高过人类好几个数量级。 理论上他们未来可以更厉害。程序员可以不懂音乐,他们可以招人啊。
@@kong4902 创造力是需要自由意志的,AI永远也不可能自由意志。
AI的评判标准是形似度,它是有很多维度的标准来衡量,美学没有很明确界限的标准,说白了,你不能列出来什么是美,什么不美,因为每个人审美本来就不同,既然你没法告诉计算机什么不美,计算机也无法给出符合标准的答案。这跟学计算机还是学文科没一点关系。学计算机的,未必不懂音乐,不懂美学,就像一个文科生在聊AI也可以夸夸其谈!
当你说ai不能创新的时候,说明你不懂ai,也不懂创新,还有人说没有自由意志的,说明他也不懂自由意志。
也不是不能创新 问题是在人类主场 出来的新东西跟人类情感不共鸣直接被否定。碳基文明已经成了文明进化的阻力。
我現在喜歡自己填詞用AI寫歌,主題都會設定為:太空/虛幻/冷,發揮AI的特色,能讓歌的表現更昇華,藉由自己填詞更能強化此部分
叨叨老师 遥遥领先!!
你的评价让我想起了李世石对阵Alpha Go赛前来着各路围棋大仙对ai围棋的嘲讽想想也挺快的 都快十年了🤣
要打专业词曲创作人或许还不行,但要做个抖音歌曲还是没问题的。
我这几天也玩了,也反复测试改进了prompts。歌写得不错,简单的器乐小品也挺好,管弦乐、交响乐一塌糊涂不忍卒听,顶多是乍听挺像,多听几秒就发现是一团乱麻,动机、发展完全没有。可以说现阶段还只是个可爱的玩具,未来可能进化为强大的工具给业内人士服务。“代替”严肃音乐家写大型作品不可能的,技能树不一样。作曲家的核心技能确实可能因为ai而改变,组织、整合和管理资源的能力会越来越重要,这个趋势已经开始了。
人家才出世几天,叨叨老师就觉自己稳了,看得真化,没事,等俺满月,你来喝酒时咱们再切磋哈~ 😂
选择自定义模式,风格选成Fugue是可以生成赋格曲的
叨刀好,你遥遥领先,遥遥领先!
不是ai本身搶工作而是會用這工具的人一個當一打用
嗯 有意思,因为中文歌的所有sample里面没有狐狸叫的这种歌曲。。。所以做不出来 ~
我覺得以英文作出指示的結果會更好。
个人不喜欢不押韵的歌词,但现在也有些这种类型的歌也不押韵的,就像现代诗不押韵一样,和这类歌曲很像。
叨叨老師晚安❤
总结的很好, 现在是它在未来最糟糕的时候, 技巧上应该来说仅仅是时间问题. 但是如何融入情感, 才是未来的难点.
总结的很有道理。基本上和我所试过的其他AI差不多。
老师您稳了!!❤
喜欢你的节目🎉遥遥领先😂
Suno对短视频制作者特别有用。Hiphop 风格的音乐Suno做的特别好,这类音乐特别适合短视频,很有节奏能吸引人。
可以在广场试听一下其他人生成的作品,这个有时候运气的成分比较大
这个问题是训练数据主要是流行音乐吧,拿古典音乐喂一下model写出古典音乐应该不成问题。另外它的use case主要是text to music,不是world model,所以可能像fugue这样有诸多要求的情况短时间内不会有什么改善,毕竟数据集不可能大到让model充分理解规则。当然如果chain一层llm作为interpretation layer,把fugue翻译成具体的prompt,也不是没可能实现,不过商业价值基本没有,不太可能prioritize
老师,AI 的优势不在于他能写出比真正专业人士好的作品,也是可以在极短时间写几百上千个出比一般普通人强很多的作品。
產生這麼多資訊垃圾要幹甚麼? 那怕10萬個垃圾曲子也比不過一首神曲
經常有歌手只靠一首歌走紅,但從來沒有任何一個歌手靠製造大量歌曲走紅......垃圾產生再多也是垃圾
@@ai-art-lookbook-4k 去看看垃圾音樂養活了多少個抖音大V。
AI将让很多制作音乐的人失业,特别是那些平平无奇的大多数。绝大多数对音乐的需求并不高,现在的AI完全可以很好(甚至超规格)的满足,也许有人会说AI生成的不好,但凭感觉的东西没人说得清,让AI来个几十上百个,总有一次会撞到好运,这显然比人类用天甚至星期作为迭代时间更能掌控产品质量。
@@ZZQ95 現在AI產生歌曲的數度可能一天幾千首甚至未來加碼到1天幾萬首都沒問題,請問有哪一首歌走紅嗎?
可以写古典的 用custom mode,style Orchestra, title 用 Violin concerto in d minor 之类的古典音乐常用标题
以結果論來說 ai 的確處理得比人類好有效率 但自己動手中的過程及成就感不能被替代 所以我相信對於能有主觀意識的項目(如:音樂,即興)仍舊有很大的價值 而且未來人類說不定會意識到自身能力下降以及過多對ai的依賴感 開始反思便利之後帶來的效應 所以我認為ai不可能完全的替代人類
15:21 我用AI画画的期待是,我创作概念图AI细化,AI想干的是它创作,我给它P成五个手指 😑
你用custom模式,类型写symphony, 然后随便胡诌一个标题,比如anthem to the hero,他就真能写一个很交响的交响
真的是非常好看的这一期,太有意思了
聽到最後,還是覺得你彈的更有味道更好聽,立即舒暢了的感覺!
你好,朋友,请问你的视频下方的半透明进度条是怎么制作的?是用什么软件剪辑?这个进度条的专业术语是什么?能告诉我吗?谢谢
大哥 您要求俩声部 还要求那么高 我试过让它写个巴洛克风格的 没别的要求 你试试 简直爆炸了
AI 的发展速度很快。过6个月再试一下,说不定你完全呆了
我的感想:AI學習非常快,只要給他學習所有風格、曲式,他也能做出類似作品,剩下的是曲中有沒有人類感受到的 "靈魂(情感)"。因此,AI做流行歌曲(詞加曲)很有價值,因為流行應用不一定有極高要求,如YT影片配樂,YTer自己就能搞定;還有多產的作曲者,可用AI找靈感來輔助 "生產力"。至於純古典,因為太專業,AI能做也未必能達到行業要求,因此AI可以先繞開。
穩啦!加油!
感觉classical可用的喂料应该还挺多的,甚至可能还相对更能规避版权问题,可能现在资源只够攒一台写流行的模型吧,其实感觉写风格特征鲜明的曲风ai还是挺有优势的
真有本事的人,AI只会是更好的助手。然而,现实是很多需要音乐的地方要求并不高,发起需求的人并不关心什么风格、流派,只要听起来“好听、顺耳”就行,并且成本不要太高。比较遗憾,国内很多音乐工作室水平“学徒”级,制作还很敷衍,完全不对味。即不好、周期又长、费用还不低。AI就不同了,无非用它多生成几次,大不了用它生成几十上百个BGM再从中挑选最优解,岂不更好,而且报价对于商业项目相当于免费。
这种流行风格就是现在年轻人喜欢的。没有什么辨识度,但他们喜欢。
遥遥领先的老师,特别幽默❤❤
专业音乐人内心一定是破防的,尽管还可以批评AI这个那个不专业,但是请你们想象一下,AI现在才是个婴儿,等他再长几年会怎样,趁现在还能酸一下就酸一下吧🤣
雖然現在是嬰兒但以後越來越難聽到"新的經典好歌",AI音樂是可以越做越好但會有極限然後越來越差,就像養殖魚類會有種魚,種魚繁殖的後代品質一代不如一代,繁殖個幾代後業者又得到大自然找種魚,當大眾看到作音樂能被AI取代就不會想走音樂這條路導致作曲的人越來越少,於是AI能在大數據裡找到的歌就永遠是那幾首歌以及AI生成的歌,於是AI作的歌就越來越差,因為人有聽歌的需求會被感動而AI沒有
@@daiqiqi8935 说的有道理,但是AI并不是只限于模仿和拼凑,他会像人类大脑一样在吸收了大量信息后再创新,而且新一代的受众在遍布AI的环境里欣赏习惯也会发生改变,整个生态就变化了, AI带来的或许是灾难,不管怎样,过去时代的经典音乐越发珍贵了。。。
照相取代了绘画吗? 工科生觉得自己可以搞”艺术”啦? 以为自己学过几个计算机语言,就能当贝多芬、莫扎特啦😂
@@wuaaron808 成千上万的音乐专业本科生研究生博士生,有哪个成了贝多芬、莫扎特呢😇
你连音乐是什么都不明白。就别在这扯淡了。你爱听AI抄袭仿写的音乐,恰恰说明了无产阶级的低微出身。毕竟,培养艺术家和艺术爱好者,是中产阶级以上家庭才可能的事情。
油管在“我给大家听一下什么是赋格”之后插播纯音乐背景的广告,把我吓了一跳,差点颠覆了我对赋格的认知。
AI就像下圍棋, 高端版本只要算力足夠和程式不停優化, 超越人類越對是有可能.
试试这个prompt: piano sonata in A minor in baroque fugue style
需要classical music ai 来满足钢琴fugue和交响乐了
已經有了
计算机写赋格因为有规则的存在应该更容易,但今天大家说的AI通常是指ChatGPT这样的“生成式AI”,它的最弱的项目就是逻辑,比如做小学数学题。所以写赋格很遥远,模仿出“情感”倒是更近一些。
这个软件没有做太多专业定义,博主的词都是在音乐这个context下的,但没有特别告诉AI
你是个非常有趣的人,我每隔一段时间都会集中看几集你的视频,你的视频带给我的是轻松愉快,和认识另一个男人类型,可以说是和我的男人平衡一下吧,我的男人是典型的理工好男人。😂😅😂😅
Midjourney刚开始红火的时候,就有大批的二三流画家出来吐槽,我知道那是他们的哀嚎。suno出来之后,我也是听到不少的哀嚎,当然也有不少人开始探索新的方向。AI势不可挡,面对吧,别当九斤老太了。
只是AI種類問題,每個AI各有專業,有其他AI是專門用古典樂去做大數據,因為古典樂沒有版權問題,是最初AI音樂的發展起點,反而沒有流行歌曲的AI,古典樂的AI早火完了,現在流行樂才跟上。我不認為古典樂在理論技術上不能實現AI,因為古典樂有更多系統是可複製的,就像數學,影片說的對位法之類,只是這款AI專注流行音樂數據。 但總結都是一樣,要生成時間,要挑選或修改。沒有思想與情感表達(但現在已經有總結出一些情感表達上的技巧,因為每首歌的表達都差不多,只要曲式相同,大家情感表達上的技巧做法都差不多,所以AI反而是做不到特別的異類,而這種異類就是創新)像媒體行業,有些背景音樂都是公司的音樂庫挑出來的,但比起AI音樂,更好的音樂搜索功能會更實際,因為現在已經有很多免費音樂庫/一次性支付的音樂庫,沒必要AI生成,而且描述命中率低,本身就沒有近年能取代音樂人的可能性。另外開發搜索功能會更實際,但沒有人想做就是,畢竟看著就不吸引,沒有熱誠,沒有社會的免費宣傳。
音樂沒有記憶點我覺得不算是缺點吧,就算是人類創作的曲子也不是每款都能成為家喻戶曉的曲子的。
GPT-2的水平,等GPT-4的水平,要啥给啥
看起来目前主要问题有两个,一个是训练资料不够丰富,再有一个是类别不够细分垂直。但是感觉这都不构成本质的阻碍,相信不久将来就会出来更加完善的版本。
它的交响乐是Yani 那种orchestral 😅
還有 : 如果你真的喜歡創作 , 歌詞你「必須至少」有 30% 是自己填的 !!!!! 退一步你至少你也要提供「5 組關鍵字」, 再由 AI 幫你「加工」, 否則作品就「沒有靈魂」, 也不算是你自己的「製成品」..... AI 是根據你提供的「字」來決定派一首怎樣的歌給你的 !!!!! @@
上次看到你是周杰伦出新专辑,这次是SUNO。解析的很很好,支持!
冯老师,英文应该输入two part invention 试试看。说不定更像巴赫的赋格了。
叨叨老师~看了一半觉得你用song description 是不是用华语写~还是你用华语翻译成英语不够完整形成AI 没有达到你的要求~只是我的疑问毕竟AI资料库多是用英文形成🙏🙏🙏😁😁😁
我猜它training data里大量的是流行乐所以不会写各种genre的。但是很有可能下一步会像stable diffusion一样,出现一些lora或者checkpoint model,专注于某一方面的作曲。我们建筑设计领域目前用ai画图感觉最有用的地方是前期开脑洞的时候。不知道这个对于你们专业音乐人来说,这几个曲子有没有开脑洞功能,能不能帮助你前期创作激发你灵感呢?
做环境背景音乐,电视剧背景气氛音乐足够了。拿下来音质,音源再提升提升即可。
AI迭代速度 今天你瞧不上 明天你追不上😂
使用AI 要学会精准描述要求 如果不好 可以继续反馈给AI 它就会学习 然后改善。 这个才是人机交互的方向
當初柯潔也說AlphaGo贏不了我😂
AI最强大的地方不在于它现在能实现多么好的效果,而在于机器的进化速度远远超过人类,明年,或者十年之后,AI会更加让人感到惊艳
这属于悖论,问题是机器发展太快之后人类根本理解不了。就拿围棋来说,alpha go对人类的棋艺理论没有任何指导作用。你根本看不懂机器在搞啥。。。
技术奇点爆炸😂不用半年就刷新一轮认知
什麼明天十年,現在AI訓練是幾個月會換代升級了
人類快逃吧,這領域沒有人類謀生的合理利潤了
按照AI学习的速度和芯片的革新用不上10年
@@waffenss1234567 其實不需要月了,目前一個月內可以做到可以迭代。人類的利潤在於你有沒有能力接受跟學習它,現在要逃避不學習的未來就魯上加魯
现在AI发展方向有点奇怪,本来想AI帮我们洗碗扫地做家务,我们就可以有空去写诗画画做音乐,现在AI开始写诗画画做音乐,而我们还在洗碗扫地做家务……
對!有沒有搞錯啊!
most underrated comment.
ai肯定是从智力活动到体力活动发展的。智力活动只要算力,体力活动不仅要算力还要配套硬件
你知道原因嗎?
我怕說出來會得罪到很多人,但是我還是說一嘴好了
現在的AI非常仰賴大數據這東西,但是大數據不會天上掉下來,這時候哪邊有人類智慧結晶的大海?沒錯就是互聯網上,且還是免費的呢
一台機器人要學習現實生活中的家務事有多困難,我想不用贅述,你首先要把機體做出來然後在沒有辦法加速時間的情況下看它跌倒個好幾年,慢慢才學會站起來
但是語言還是繪圖的AI,全都是使用虛擬的數據,這類數據不只是免費的且還可以靠算力加快速度,變得異常簡單
在現實當中AI學習行為難以使用生成式對抗網路(GAN) 的方式,你只會看到兩個機器人都在跌倒更別說一個要去絆倒另一隻機器人,不現實
但是虛擬數據靠演算法卻可以形成生成式對抗網路(GAN)的方式來掛機等結果,這完全就是省力的作法,還能靠算力去縮短時間,何樂不為?
因此你現在看到的AI就是利用全世界人類在互聯網上的足跡,使其達成許多人認為的"想要取代這些互聯網上的創作"這件事
用數學觀念想一下吧,會有什麼問題?
哈哈哈,您老牛
没关系,这一版你看不起我😂,下一版虐死你😊
那还真还不一定,也有可能还要十年
@@feifeishuishui V1~V3只用一年時間,根本不用到10年那麼久
@@_gameronin9002 机器学习又不是什么新东西,几十年前大家就觉得希望就在前方,跟你现在差不多的思路,结果ne,已经错了几十年了
@@feifeishuishui 幾十年前是有概念沒有硬件跟數據支持,如今的硬件發展越來越快,數據收集的規模也越來越廣泛,不然為何自從ChatGPT一出名後AI產業會如雨後春筍般一直冒出來?科技的發展只會越來越快,用過去的十年跟現在的十年相比會差很多,所以我才會說不用十年那麼久就能出一個連音樂人都覺得有威脅的,但也要看對方願不願意出
@@_gameronin9002 你先要证明作曲和其他问题需要的硬件是同一个量级。你能证明吗,还是想当然拍脑袋?我看你也不是做科研的,也许科研的思维方式对你来说很难理解
作为一个独立音乐人 我对sona的使用评价: 超过80%的 歌曲质量
歌曲稍微加点流量加持是能火的 这已经满足商业价值了😢😢😢
叨叨结尾所说的很多“需要”,我觉得要达到要求,需要有两点,第一是有足够的训练数据,第二是要有相对完整合理的prompt提示词。
叨叨在本集视频里演示的生成,提示词略微有些弱,如果再加入更多细节,比如扩充到一百字以上的描述,生成的结果会好很多。也可以听一下生成榜单上歌曲,学习一下别人的提示词
而且他老人家只生成一对儿就拿出来评价,没有任何说服力。
@@biotester 是的,写提示词prompt也是一项非常专业的技能,需要一定时间的学习和练习迭代才能掌握。我相信以叨叨这样的学习能力,如果能达到100小时以上的prompt写作经验,再加上其对于音乐的理解,一定能得到非常多惊艳的作品。
今天无事用suno生成了几个前奏曲与赋格,虽然不一定“惊艳”,但是听着很像那个意思。我猜冯老师还是没有使用正确的prompts,或者没有生成足够多的样本。不断尝试是作曲的一部分。@@knowknowhow
我觉得AI想代替职业作曲家还早得很,但是干掉一批一天10首歌的抖音神曲写手,还是绰绰有余的
那你还真是低估那些抖音烂口水了,那帮音乐人就目前看可比AI更懂得大众群体听众。你甭管那些歌烂成啥样,架不住听得人多,AI可做不到这一点
@@Valen2CN話是這麼說,可是打數法則,AI一天生個幾千首,總有幾首、甚至幾十首可以做到特別洗腦
不會的,以後抖音會有一堆AI生成的東西,幹掉一批是不會,因為他們也能使用AI
還好周杰倫沒有出在這個時代,不然真的直接被取代掉
那可真是太好了
能到这个水平应用场景就很多了,比如自己拍的短视频配乐,给网络小说配个主题曲,插曲,种种对音乐要求不是特别高的场景,AI水平上短期肯定达不到专业人类的水平,但是它会扩展出几乎无限的应用场景,以前拍视频得用专业的摄像机,普通人用都不会用,更别说剪辑配音了,现在随便谁都可以拍视频配乐了,水平肯定不如专业人员,但是成本低啊,海量的数量里肯定会涌现精彩的作品。
大師也許不會被取代 但產業金字塔中下層的大量被取代掉
但是大師會老會死,而且大師也從中下層練功累積經驗技術,才成為大師.
產業沒有中下層的生存空間時,以後大師也會絕種.
而且你大師再怎麼掙扎,你掙扎時的努力,都是AI訓練進化的養分. 因為你的掙扎反抗,導致AI更有能力取代人類
產業未來路線已定,我們不需要騙自己,現實就是這麼殘酷
叨叨可以看一下prompt engineering(提示工程), 总的来讲我觉得给AI好的提词比一般的提词得到的效果相差巨大。我喜欢你的节目,但是我觉得你给SUNO的提词还有很大改进空间.
叨博大概以为字少点的要求比较简单,正好理解反了。对agi而言,描述越清晰(字多点)任务更简单,字少的反而难。
从演示的效果来看,很明显就是这个模型学习的训练数据不足,模型收敛也有问题。本质上AI模型是根据大量的参数权重,去拟合出来一些概率,视频里明显就是处理自然语言问题的时候,没有理解交响乐,只是把“交响乐”输入模型,模型给出来的是钢琴概率很大,然后后面的音乐模型就去做钢琴的生成了。整体上感觉这个模型的结构还是没啥问题的,只是在于训练不足。毕竟Suno AI不太可能像OpenAI那样烧掉海量的资金去专门针对作曲来组织训练数据,然后训练模型、调整参数。但是千万不要小看AI,AI厉害的地方在于总结出来一种数学范式,按照这个范式可以很容易的实现自然语言理解+各种类型的生成(图片、视频、音乐、文字等),范式是固定的,只要不断的提高训练量,就会朝着既定的目标不断收敛,最终量足够大,就会产生类似“量变引起质变”的效果。只要有人愿意烧钱,把从古到今所有的音乐作品按照数字格式进行整理,拿去训练模型,不断调优,那么最终产生的效果肯定是惊人的。
关于创新,特定到音乐领域的创新,从模型的视角来看,我觉得可以分成2种,一种是从已经有的音乐里融会贯通,进行组合式的创新,比如把不同的民族特色音乐+西方音乐乐理,产生新的音乐形式。另外一种就是完全从0到1。前一种AI模型很容易做到,后面一种目前看来还是只能靠人。
纯猜测,这个训练数据很难做到足够,训练一个稳定的机器视觉的行人识别需要的数据量可能就比整个巴洛克时期的谱子加起来都大了,学到的特征其实也就那么几个
@@wodddj 训练量是可以足够的。因为可以利用生成式AI来生成音乐让AI来学习。 虽然挺起来很扯,一开始科学家也这样认为,但是确实有效。 特斯拉就是这样做的,否则特斯拉也不够足够训练样本给AI训练。
这个AI 主要就是不够钱同时不够足够好的人才。
你對AI的認知也有缺陷,你說的是AI當中的泛化性跟擬合性,這個是天秤的兩端點,泛化性越高的AI他對於針對單一性的認知就不足,反之,過擬合的結果就是等於大數據,但因為不存在AI能夠擬合到還原大數據,必定存在隨機性,因此會有所謂的LOSS值,這個LOSS值最終會很接近沒錯,但是他會到一個程度後收斂至終點,而這個終點距離標準答案還有很大一段距離。
你說量變引起質變,我的解讀是GPT語言模型利用參數的堆疊最終在一個複雜的問題當中透過黑盒子函式的交互"感染"下得到更具有"全局觀"的回答,我沒說錯吧?
但問題是,創作本身就是很個人的,在AI的理解當中去看人類創作的大數據會發現光是定義"終點"這件事都充滿矛盾且難以有高度的正相關,這時候很多搞AI訓練的程式員就會為了證明該AI可以用這套方式運作,自己成為了定義"終點"的老師,這也是為何同一份模型越訓練越會成為某一個小群體,這就是擬合過程,擬合到一個程度後,這個AI模型就會失去泛化性,在應用過程當中對於某方面做得異常的好,而另一方面異常的糟糕,很多AI公司發表成果都只拿出某方向過擬合的產物,而給人造成一種AI什麼事情都做得好的錯覺,這種倖存者偏差在統計學領域也是時常見到過,AI就是一種統計學當中常態分布的計算機而已,一個完全靠相關性逆推因果的機器。
有一個有趣的東西,你所使用的所有數字密碼,都在現在已經解開的圓周率小數點後面的某一處可以找到,這代表你的密碼已經被破解了嗎?
並不是,而是撞庫行為造成的偶然性,在足夠龐大的隨機當中人類的一切都可以剛好被解出來一段,但那並不代表這串數據是有意義的
意義是什麼?AI在生成過程當中,它無法給它生成的內容下定義,唯一能做的只有你自己,你給他滿分對它來說也沒意義,因為你正在使用它的輸出功能而不是訓練過程,它唯一做的就是在擬合的過程當中如何的讓你剛好去定義它的產物是"好的",這件事。
判斷好壞不是AI做的事情而是使用者作的,因此普羅大眾只要無法分辨它不好,那麼就能在AI公司商用過程當中運作。
人類創作的資訊是意識的展現不是撞庫出來的,即便一座山長得像佛我們也可判斷這是自然沖刷力而不是人類雕刻的
為什麼人類可以分辨是否為人造物?因為理解物理法則,知道大自然的能力極限在那邊,人類利用工具可以做出更精緻的產品
即便是一塊石頭,不管花上幾億年的沖刷也不會成為芯片,因為人類文明的創作是高度意識的,AI學不來,即使適用相關理論也歸納不出來
圖片AI生成幾億張圖片也不會出現一個你過往的愛人,最多就是你誤以為是愛人而已。
@@achillesarmstrong9639 你說的是對抗GAN訓練方式吧?
這招不怎有效,但是很省人力,主要出在你開著電腦給他跑就好了,最後他會擬合出結果,當然都不會是你要的那樣,但你可以一直掛機讓它跑,跑到你驗證結果覺得....還堪用吧
你就發表出去,看看其他人買不買單,不買單就繼續換點參數在繼續跑
我說真的搞AI模型訓練根本不用什麼技術力,要的是算力夠,剩下的就是花時間等待而已,智商?
感觉AI如果有自我意识的话 就可以达成从零到一
我記得它的敘述有說盡量以樂曲風格,而不要使用藝術家或歌手名稱作為描述方式,因為他不太認得名字
巧遇
目前版本模型最大的問題在於SUNO團隊太有良心了,因為他們輸入訓練的內容就官方表示都是自己作曲去訓練的,以至於很多古典的資料量不足,而曲風也更偏流行泛用.如果今天他能有跟google或是open AI一樣的大數據來支撐,估計這個影片遇到的很多問題都不會有.
目前很多AI功能拉垮的原因不在於技術本身不行,而是各個AI領域及企業之間設定的門閥因為商業利益沒法整併功能,比如Chatgpt或Pi的自然語言模型及數據如果能跟SUNO整併,估計不會有你要他寫賦格結果出現的是只是它資料中盡可能接近的亂七八糟東西.
以目前能夠提供文字及大致結構就能產出一首對大眾而言能聽的東西已經是相當大突破了.當初midjourney也是一樣,大家吐槽她手指問題或是畫風明顯ai感,到現在很多照片你甚至要放大倍率去細看分辨到底哪個細節是人類繪畫痕跡哪個是ai生成的軌跡.
附上一首自己玩得很開心的歌,用過去寫的詩生成出來的音樂,不考慮細節整體還蠻好聽.
ruclips.net/video/nxIvO8NNDRI/видео.htmlfeature=shared
midjourney當初就是有良心的那一個,後來SD盜圖AI出來就把它輾過去了
先不提到底叨叨的提詞寫的好不好,畢竟就是一個一般人寫的水平,不需要也不必太精就,但叨叨的音樂素養是學院等級的,他評判音樂性跟結構是絕對比大部分人要專業的多,就算提詞不夠精進,但評判音樂也夠了。
直接用Song Description的話
AI經常會分不清楚哪些是提示詞、哪些是你要的歌詞
建議點開上面的Custom Mode試試
可以把歌詞跟提示詞分開來描述
會比較精準一些
至於提到音樂家名字
我試過寫"像某樂團的歌"會直接拒絕生成
不確定古典音樂家是否有某些保護機制而故意做不像
對,可以試試custom mode
我沒遇到拒絕生成,會拒絕大多是你額度用完了,只要你要求它生成最多就是給你很不像的東西
我好幾次生成出來連唱準字都唱不好,它的隨機性還是很高的
關於你說很像某樂團的歌,曲風當中最具代表性的就一定能骰到該樂團的曲風,所謂的樂團它的理解是風格,而SUNO對於風格的TAG非常細,你可以寫上十幾二十個都能,包括註明語言如Chinese vocal、Famale vocal等
@@user-E04SU3XL3G
不是額度的問題,我是直接寫song like Metellica
他會顯示描述包含藝術家名稱而拒絕生成
而且不會扣除額度
試過好幾個當代樂團都是一樣的情形
快了 各行各业只有顶尖人士可以幸存
不是頂尖 依照博主說法 AI目前只能拿3分 問題只有3分的人類根本不可能在這個行業混下去
哈哈视频白看了,别在这儿散播谣言和焦虑了。
suno帶給我的是讓我玩一陣子後,我又回去練鋼琴了,激起我的創作欲,當然suno本身產生的東西幾乎無法修改,所以我去購買音樂製作軟體去抓感覺還是比較靠譜的。
Suno的強項是寫各種風格的詞曲。如果你去檢視它裡頭的範例並加以模仿,會發現其實挺強的。最近還有一款更強的AI作曲工具Sonauto ,寫歌寫曲都更勝Suno 一籌,而且完全無限制免費,只可惜目前無法寫出中文歌。
I write lyhrichs in chatGpt, and musicstyle also, than with suno create
叨叨可以考虑再录一期. 试着去从那些拥有最多数据量的音乐领域来考察 suno . 看其再得到充分训练数据量时的表现. 并且我觉得 suno 或其他的音乐生成式AI下一步应该从扩展训练数据和专业音乐从业人员的fine-tuning 入手来改善生成质量. 听了好多叨叨的视频虽然我其实根本听不懂. 但还是很喜欢. 让我这个门外汉知道原来音乐是这么的有规律可循而不是一时的灵感和创意. AI训练数据集除了使用互联网中的音乐推荐标签. 恰就是需要叨叨这种能分析音乐背后逻辑的人来为训练提供数据支持. 来使大语言模型不单单从非专业的听歌人那里获得简单的喜好标签和音乐类型标签. 也从专业音乐人那里获得乐理和其他一些更专业的数据.
这种通用型大模型最大的问题就是,它不为专业考虑。通用二字反而成了这种大模型最大的一个限制。
主要问题是单个标签的数据量是严重不足的,比如我要训练它写technical death metal,你也不知道它是学会了还是overfit了
@@wodddj 对啊,专业人员的量也不够,没办法提供这种专门的调教
这期必须点赞👍!❤ 因为我全听懂了!😂
稍微有点想反驳一下评论区关于提示词的说法。
确实,目前的AI,准确的提示词,甚至可以互动的提示,对结果影响很大。但是很多基本的问题仍然需要AI能在没有多余提示词的情况下回答。比如“两声部赋格”、“贝多芬风格的曲子”,这些不应该需要更多提示词。当然也许叨叨可以试试,比如,“写一段两声部赋格,只有一个主题,高音区先出现主题,此时低音声部别出声。第一声部主题结束之后Blablabla,然后第二声部进入并且演奏主题。主题请至少有10个音符,至多50个音符,最短2秒,最长5秒。该主题在每个声部当中至少出现10次,占各声部总时长至少5%“。但是我觉得,即便这样(几乎是在教AI),其效果大概也会差不多。而且假如我问AI,1+1等于几,还要加”想想1个苹果又添了一个苹果是几个苹果,桌上有一个梨我又放了一个梨那现在桌上有几个梨“这样的提示,那这AI实在是够糟糕的。
至于发展潜力,希望它能解决更多的问题吧。但是像另外几个评论所说,到目前为止,没有哪个AI不依赖大数据。那么比如让它写赋格,人类现在写出来的赋格有多少首?巴赫所有作品也就上千,后人写的赋格恐怕更少,而制造这种训练数据恐怕不会很便宜。
P.S.: 其实我觉得13:03那段有点门德尔松的风格哈哈哈。
等你出这个话题的内容等很久了😋
我用了一下 试了很多乐风rap country rock jazz classic等等 感觉下来就是比较匠气,可以很快的出一首入门以上的音乐。之所以很惊艳一是因为作曲作词速度很快,二是预期低,三是听了太多抖音神曲发现这水平已经不低于完全没门槛的抖音神曲了。想让他做更好的方式其实是更详细的描述而且是用英文,这就意味着你自己还是要懂音乐还要懂prompt 但水平也很难到正经从业者的水平。。所以目前来说还是玩乐用
音乐其实比美术更有科学骨架,正是AI很适合创作音乐的基础。很喜欢叨叨的节目,你的频道本就是拆解音乐的科学逻辑,但这期有些欺负当前AI的感觉。
1. 首先prompt给的好不好是决定AI作品的关键因素,而且跟出图一样,原本就是高速出海量作品里面去淘金,而不指望必出精品。 可以看出叨叨不是那种玩电子作曲的GEEK,可以看看一些音乐软件主播如何结合其他软件去发挥AI的潜力
2. 很多人都提到了,它需要的只是更多更全的训练集,跟一些时间
3. 它冲击不到叨叨这种正经科班的交响乐成员,但假如叨叨开个工作室给广告电影写歌的话,你原先招十个人可能以后只需要一个了:)
我同意音乐其实更有迹可循。 如果好好训练一个大模型,应该可以做出好的曲子。 但问题是,训练大模型要花很多钱的,谁来买单呢?
我觉得还是因为音乐包含的信息量更少,哪怕20种不同乐器,包含10个八度的所有音,也没有多复杂。哪怕结合人声,也可以直接从波形提取样本点来分析
从 AI 画画的进展速度来看,我觉得音乐也快了。叨叨, 别着急。可能过不了太久。 只要能够数字化的东西,AI 都可以学习和演进。 而且我觉得 AI 可能会采用强化学习的方式,自己作曲,自己打分,自己提升。 就和 Alphago下围棋类似。
我用了 SUNO 一個星期左右 , 我認為 AI 五年來都沒可能取代作曲家和填詞人 ...... 原因 :
(1) AI 不懂得將歌曲中段變奏 , 比如 INTRO 以「平和」開始 , 中段想變 ROCK , AI 不一定能「派」得到合適「選段」給你 , 你可能要捨棄 10 多 20 個「樣版」才好運地得到「合用」的。
(2) 音樂「造句」不完美 , 以普通話創作相對容易 , 英文相對難 , 派出來的 AI 段 , 有時有點怪怪的 , 不容易「一聽就會唱」........
(3) 你不能完全掌握「編曲」, 本來想要電結他作主角 , 派出來的 DEMO 就變了琴鍵為主角 , 想要日色搖擺 , 就變了美式 POP =.=
(4) AI 歌詞比較直接 , 不會有隱喻功效 ,
例字 : 在我的作品中 , 有一句 : 我沒有超能力 不能飛越壞天氣 , 但時間和空間靠科技打破距離 ....... 是比喻「互聯網」, 這種句子 , AL 「暫時」還沒趕得上這種文藝水平 ......
(5) AI 不太懂替歌曲結尾 , 很多時不能「首尾呼應」
(6) AI 不能跟真樂手相比 , 有時有些歌曲 , 有些「空位」本來該是來一段電結他 / BASS SOLO 間奏 , 可是 AI 平淡的「奏過」, 感覺像吃日式咖哩豬扒飯 , 卻沒了豬扒 ...... (喜歡音樂的一定明白)
(7) 不懂男女對唱 / 女女對唱 ....... 不懂分工 : A 段由 A 唱 B 段由 B 唱 , C段 A+B 一起唱 =.=
(8) AI 派出來的段落 , 還是要花不少時間修改歌詞 , 再重造 , 再修 , 再重造 ...... 做一首3分鐘左右的歌 , 我通常要花三幾小時才能得到滿意(不是完美)作品 .......
利申 : 我不是音樂人 , 只是音樂迷 =.=
就连专业人士使用目前最好最专业的VSTi编曲,遇到solo都是要 制作 好久的,还不包括创作,就是制作成符合要求的演奏,都十分困难。
如果说suno能底层上解决这个问题,他就算不以AI作曲为产品,光是为编曲人士提供 如此简便的 以假乱真的乐器solo的vsti甚至是offline audio generator,都已经可以 狂卖 来替代现有产品!
综上所述,可想而知,在不能解决自行演奏乐器的能力下,要弹作曲,还是先继续卖广告去吧
其实可以之后发展不一定要生成整歌,也可以像copilot一样嵌入音乐制作软件里,像AI绘画被诟病的最多的一点就是不分图层所以没法修改,也就没法嵌入到画师的工作流程里,但AI编曲可以生成MIDI文件,MIDI文件就能在作曲软件里修改了,就可以加入到工作流里
AI未来会以廉价的方式满足很多人的感官需求,也会让人更快速地从感官的刺激里感到厌倦,倒逼出全新的生活方式。可能是向外寻找新的艺术,或者走向复古,或者向内心求索什么是真正的满足感和人生的价值。这种技术会是我们这个时代的人类的课题,机会或者挑战。冯老师这一期我觉得很有意义。
感谢分享,观点分明,举例充分,有说服力。但也不能低估ai的可塑性和成长性,对于有确定性规则的问题,不论规则多复杂,ai必将超越人类。博主关于交响乐、创意上ai很难学习的观点,我持保留意见,规则更开放偏主观,评价标准难以量化上
可能是训练的时候主要用了流行音乐,其他类型的音乐只要下一步多给点数据应该也能做的更好
这就是AI到网上去自己扒下来的吧。因为这种训练需要大量的数据,靠人类去打标签去分类,根本就不现实。人类对文字还可以提供某种监督,因为大家都是识字的。你只要愿意找足够的人来做打标签的事,或者是来做打分的事,都是可以做到的,但是对音乐就不行了。你找不到那么多懂音乐的人去监督AI学习。
@@wujingping
不可能让ai自己去网上扒的。爬虫这么简单的东西不需要ai,手写一个就行了。
这种 model 需要的数据基本上也不需要打标签,现在很少有监督学习的generative model 了。
@@notepadpowersnail1860 训练素材都是扒下来的
ai强项是学习能力强,冯老师您这种只给一两句简单的描述,希望ai能给出您满意的结果,不是不行,而是ai也需要学习您。如果您有一个ai一直在用,他了解了你,然后你通过他再去调用其他ai,那我觉得结果您应该满意。
他或许现在还看不上这些工具,但有一天他会离不开AI,不会太久的至少他这代人一定会看到
看了一半先评论,我觉得应该是训练数据全都是流行音乐,所以写啥都是流行味
可以选不同风格
能胜任很多背景音乐的创作了。
AI的可怕之处在于进化速度。一个人需要经过多久的训练才能达到目前Suno的水平?接下来一年时间内还能提高多少?而AI在未来一年时间内能提高多少?雇佣一个能达到目前Suno的人写一首平平无奇的曲子需要多少钱?如果把时间成本和沟通成本也算进去的话,比AI高多少?
另一个让人沮丧的事实是,多少人具备分辨好的音乐作品和平平无奇的作品差别的能力,并且愿意为这个差别而付费?在大多数场合下,即便是目前Suno的水平就已经绰绰有余了。
你說的沒錯 但現實是你根本不會想僱用一個水平跟Suno一樣的人類 甚至這位和Suno同等級的人類應該需要付費上班 那麼 Suno有付費給你嗎?
挑剔AI的過程中⋯也要留意他們可是在1分鐘之內就做出來,這才是可怕的地方
刚好前两天和同事聊起来这个就把聊天时的一些想法写在这儿吧. 现在的多模态大语言模型既非语言对语言的内容生成. 或者更直接点说使用语言描述生成图片,音频, 视频等生成式大语言模型. 最关键的是训练数据量. 其实这几年随着互联网音乐服务的不断成熟. 大量的音乐被用户们所标记. 这样就天然的为训练提供了基础. 这正是大语言模型突破点所在. 从这个视频其实也可以看出这点. 叨叨如果询问一些互联网音乐中被大家标记的越多的音乐类型其生成结果就越好. 是由其训练数据所决定的. 和几年前的想法完全不同. 几年前我认为 AI 的革命会首先替代那些简单的非创造性的工作. 而如今看来恰是那些原来被我们人类引以为傲的行业更容易被替代. 甚至那些高度依赖于创造力和知识性的行业. 如果给予充分的训练数据和计算资源我相信在特定的音乐领域生成式AI很快会达到或超过人类. 音乐领域决定于其领域的数据量与标记量. 别忘了从不会围棋到超过所有人类棋手AI仅用了不到2年的时间. 那时的资源和算力远不是今日可比的. 在未来5-10年虽然不会所有的从业者都失业. 但会极大的可能性颠覆整个行业. 即便最顶尖的音乐创作者可能也会反过来从AI生成音乐中获取灵感. 而一些从业者(60%-80%)可能真的会失业. 不单单是音乐. 像是插画师, 视频编辑, 律师, 家庭医生, 教师, 程序员等等行业. 其中优秀的人可能会更优秀通过AI获得更大的能力. 而这行业的普通人可能真的就会被AI所替代....
因为这帮搞人工智能的人野心太大了,他们总是想搞一个通用大模型。这也就导致了他们不肯去专门为某个小分类做特化训练,你如果这么干的话,那还叫什么通用啊?所以你会发现,AI有很多bug始终补不上。因为与其花这个死功夫去补这些小bug,还不如开辟新领域。做完了生成文字就去做生成图片,做完图片就去做生视频,做完视频就去做音乐。谁有功夫给你补BUG啊?
問題是,現在又有多少個所謂的音樂人能寫出好聽的賦格曲子?
音樂和數學有關,AI要做到也不難吧。
应该是train它的训练集还不够丰富,假以时日,现在的训练集可能多是流行歌曲比较多。不过这也看到一个前景就是音乐专业从业者也可以投身AI领域去更好的发展不同领域的AI。
冯老师对AI能力评价到位🎉!同时,我是觉得,AI软件公司缺少冯老师水平的艺术指导,给AI学习的内容不足,造成现在AI的创作缺陷。伊,冯老师的机会来了,嘻嘻
这你可说错了,AI比你的冯老师强太多了,这个v3就已经碾压了你的冯老师,因为你的冯老师只熟悉几种音乐风格,几种乐器而已。
不可能,做音乐的AI能没有业内指导?
如果按目前圖畫照片生成AI的軌跡來看
要凸顯怎樣的特色、特色要用什麼類型,是需要生成者來給予
越要在特色中別具創意,也越需要生成者提供細節
要越多更具體的『要求指定』,生成者也需要具備更多AI軟體中提供的各種功能工具(處理各式各樣狀態的輔助工具)
也就是
生成者如果給出越少的訊息,那AI出來的成果就是抽卡,時好時壞,抽到生成者滿意為止
但如果生成者有越多的要求,那生成者就像是草圖或是概念構思者,AI就會扮演『完稿者』的角色
在繪圖生成的領域,AI 善於『風格延伸應用』與『融合不同風格於一幅圖』的能力
人類要想像同一風格延伸到不同題材、主題的創作
或是要將不同的風格合理的融會在一起,產生視覺新鮮感
這兩者要達到協調感,都是不容易的
例如『水墨寫意風格的寫實感畫作』,可能看得人會覺得這描述是什麼鬼啊,但AI就是有辦法
所以未來音樂方面的AI,我想也會達到這樣途徑的一天
到時候可玩性應該會比現在更多
要失業的何止是音樂人?(攝影,作家,醫生,老師,....)
这个挺有启发,说明AI模型测试最重要的还是subject matter expert。比如钢琴那段,一般人是不会了解赋格的定义的,所以怎么定义模型的性能是非常需要行业背景的。当然说到底,可能还是古典音乐的电子素材比较少(也就是把手写的谱子转化为电脑文件格式的谱子),所以模型没怎么见过这种音乐形式。凡是古典音乐范畴全部被模型理解为浪漫主义钢琴曲,可能这种形式的古典音乐电子素材比较多。
SunoAi 現階段搞個流行樂或者伴奏還可以。做個Demo平日玩玩還是很好的😂
我来从专业的角度来说一说我的看法,其实赋格作品的要求对于ai来说不是什么问题,我认为唯一的问题就是时间问题,因为无论和声和对位,模仿,包括扩充,反向进行等等都相对有据可查,如果让100位具有复调音乐作曲经验的人去训练这个模型去专门创作巴洛克时期的作品,我相信它能完成,但它不能完成的是创新!它只能基于目前已有的理论下进行创作,但其实这已经很厉害了,但绝对不够!单凭这一点它就永远落后于人类,还有我一直在考虑的是,怎样让ai认知美学,针对不同审美的听众制定音乐,说白了就是什么样的作品适合什么样的人,例如我就喜欢多声部的逻辑感,有的人就喜欢理查德,还有就喜欢死亡金属的,所以这个领域值得探讨的内容太多了,ai做到今天这个地步,或许在作曲领域已经是这些理科生们的极限了,再往下只能依靠我们阳春白雪的文科生了,毕竟你计算机专业的人根本就不懂音乐,因为你不懂音乐美学!
创造力应该不是凭空的, 创造力是先学习后创作, AI感觉好像走得就是人的路。 一个人听曲子学习的时间是有限的, 但是这些GPU们高过人类好几个数量级。 理论上他们未来可以更厉害。程序员可以不懂音乐,他们可以招人啊。
@@kong4902 创造力是需要自由意志的,AI永远也不可能自由意志。
AI的评判标准是形似度,它是有很多维度的标准来衡量,美学没有很明确界限的标准,说白了,你不能列出来什么是美,什么不美,因为每个人审美本来就不同,既然你没法告诉计算机什么不美,计算机也无法给出符合标准的答案。这跟学计算机还是学文科没一点关系。学计算机的,未必不懂音乐,不懂美学,就像一个文科生在聊AI也可以夸夸其谈!
当你说ai不能创新的时候,说明你不懂ai,也不懂创新,还有人说没有自由意志的,说明他也不懂自由意志。
也不是不能创新 问题是在人类主场 出来的新东西跟人类情感不共鸣直接被否定。碳基文明已经成了文明进化的阻力。
我現在喜歡自己填詞用AI寫歌,主題都會設定為:太空/虛幻/冷,發揮AI的特色,能讓歌的表現更昇華,藉由自己填詞更能強化此部分
叨叨老师 遥遥领先!!
你的评价让我想起了李世石对阵Alpha Go赛前来着各路围棋大仙对ai围棋的嘲讽
想想也挺快的 都快十年了🤣
要打专业词曲创作人或许还不行,但要做个抖音歌曲还是没问题的。
我这几天也玩了,也反复测试改进了prompts。歌写得不错,简单的器乐小品也挺好,管弦乐、交响乐一塌糊涂不忍卒听,顶多是乍听挺像,多听几秒就发现是一团乱麻,动机、发展完全没有。可以说现阶段还只是个可爱的玩具,未来可能进化为强大的工具给业内人士服务。“代替”严肃音乐家写大型作品不可能的,技能树不一样。作曲家的核心技能确实可能因为ai而改变,组织、整合和管理资源的能力会越来越重要,这个趋势已经开始了。
人家才出世几天,叨叨老师就觉自己稳了,看得真化,没事,等俺满月,你来喝酒时咱们再切磋哈~ 😂
选择自定义模式,风格选成Fugue是可以生成赋格曲的
叨刀好,你遥遥领先,遥遥领先!
不是ai本身搶工作
而是會用這工具的人
一個當一打用
嗯 有意思,因为中文歌的所有sample里面没有狐狸叫的这种歌曲。。。所以做不出来 ~
我覺得以英文作出指示的結果會更好。
个人不喜欢不押韵的歌词,但现在也有些这种类型的歌也不押韵的,就像现代诗不押韵一样,和这类歌曲很像。
叨叨老師晚安❤
总结的很好, 现在是它在未来最糟糕的时候, 技巧上应该来说仅仅是时间问题. 但是如何融入情感, 才是未来的难点.
总结的很有道理。基本上和我所试过的其他AI差不多。
老师您稳了!!❤
喜欢你的节目🎉遥遥领先😂
Suno对短视频制作者特别有用。Hiphop 风格的音乐Suno做的特别好,这类音乐特别适合短视频,很有节奏能吸引人。
可以在广场试听一下其他人生成的作品,这个有时候运气的成分比较大
这个问题是训练数据主要是流行音乐吧,拿古典音乐喂一下model写出古典音乐应该不成问题。另外它的use case主要是text to music,不是world model,所以可能像fugue这样有诸多要求的情况短时间内不会有什么改善,毕竟数据集不可能大到让model充分理解规则。当然如果chain一层llm作为interpretation layer,把fugue翻译成具体的prompt,也不是没可能实现,不过商业价值基本没有,不太可能prioritize
老师,AI 的优势不在于他能写出比真正专业人士好的作品,也是可以在极短时间写几百上千个出比一般普通人强很多的作品。
產生這麼多資訊垃圾要幹甚麼? 那怕10萬個垃圾曲子也比不過一首神曲
經常有歌手只靠一首歌走紅,但從來沒有任何一個歌手靠製造大量歌曲走紅......垃圾產生再多也是垃圾
@@ai-art-lookbook-4k 去看看垃圾音樂養活了多少個抖音大V。
AI将让很多制作音乐的人失业,特别是那些平平无奇的大多数。绝大多数对音乐的需求并不高,现在的AI完全可以很好(甚至超规格)的满足,也许有人会说AI生成的不好,但凭感觉的东西没人说得清,让AI来个几十上百个,总有一次会撞到好运,这显然比人类用天甚至星期作为迭代时间更能掌控产品质量。
@@ZZQ95 現在AI產生歌曲的數度可能一天幾千首甚至未來加碼到1天幾萬首都沒問題,請問有哪一首歌走紅嗎?
可以写古典的 用custom mode,style Orchestra, title 用 Violin concerto in d minor 之类的古典音乐常用标题
以結果論來說 ai 的確處理得比人類好有效率 但自己動手中的過程及成就感不能被替代 所以我相信對於能有主觀意識的項目(如:音樂,即興)仍舊有很大的價值 而且未來人類說不定會意識到自身能力下降以及過多對ai的依賴感 開始反思便利之後帶來的效應 所以我認為ai不可能完全的替代人類
15:21 我用AI画画的期待是,我创作概念图AI细化,AI想干的是它创作,我给它P成五个手指 😑
你用custom模式,类型写symphony, 然后随便胡诌一个标题,比如anthem to the hero,他就真能写一个很交响的交响
真的是非常好看的这一期,太有意思了
聽到最後,還是覺得你彈的更有味道更好聽,立即舒暢了的感覺!
你好,朋友,请问你的视频下方的半透明进度条是怎么制作的?是用什么软件剪辑?这个进度条的专业术语是什么?能告诉我吗?谢谢
大哥 您要求俩声部 还要求那么高 我试过让它写个巴洛克风格的 没别的要求 你试试 简直爆炸了
AI 的发展速度很快。过6个月再试一下,说不定你完全呆了
我的感想:AI學習非常快,只要給他學習所有風格、曲式,他也能做出類似作品,剩下的是曲中有沒有人類感受到的 "靈魂(情感)"。
因此,AI做流行歌曲(詞加曲)很有價值,因為流行應用不一定有極高要求,如YT影片配樂,YTer自己就能搞定;還有多產的作曲者,可用AI找靈感來輔助 "生產力"。至於純古典,因為太專業,AI能做也未必能達到行業要求,因此AI可以先繞開。
穩啦!加油!
感觉classical可用的喂料应该还挺多的,甚至可能还相对更能规避版权问题,可能现在资源只够攒一台写流行的模型吧,其实感觉写风格特征鲜明的曲风ai还是挺有优势的
真有本事的人,AI只会是更好的助手。然而,现实是很多需要音乐的地方要求并不高,发起需求的人并不关心什么风格、流派,只要听起来“好听、顺耳”就行,并且成本不要太高。
比较遗憾,国内很多音乐工作室水平“学徒”级,制作还很敷衍,完全不对味。即不好、周期又长、费用还不低。AI就不同了,无非用它多生成几次,大不了用它生成几十上百个BGM再从中挑选最优解,岂不更好,而且报价对于商业项目相当于免费。
这种流行风格就是现在年轻人喜欢的。没有什么辨识度,但他们喜欢。
遥遥领先的老师,特别幽默❤❤
专业音乐人内心一定是破防的,尽管还可以批评AI这个那个不专业,但是请你们想象一下,AI现在才是个婴儿,等他再长几年会怎样,趁现在还能酸一下就酸一下吧🤣
雖然現在是嬰兒但以後越來越難聽到"新的經典好歌",AI音樂是可以越做越好但會有極限然後越來越差,就像養殖魚類會有種魚,種魚繁殖的後代品質一代不如一代,繁殖個幾代後業者又得到大自然找種魚,當大眾看到作音樂能被AI取代就不會想走音樂這條路導致作曲的人越來越少,於是AI能在大數據裡找到的歌就永遠是那幾首歌以及AI生成的歌,於是AI作的歌就越來越差,因為人有聽歌的需求會被感動而AI沒有
@@daiqiqi8935 说的有道理,但是AI并不是只限于模仿和拼凑,他会像人类大脑一样在吸收了大量信息后再创新,而且新一代的受众在遍布AI的环境里欣赏习惯也会发生改变,整个生态就变化了, AI带来的或许是灾难,不管怎样,过去时代的经典音乐越发珍贵了。。。
照相取代了绘画吗? 工科生觉得自己可以搞”艺术”啦? 以为自己学过几个计算机语言,就能当贝多芬、莫扎特啦😂
@@wuaaron808 成千上万的音乐专业本科生研究生博士生,有哪个成了贝多芬、莫扎特呢😇
你连音乐是什么都不明白。就别在这扯淡了。你爱听AI抄袭仿写的音乐,恰恰说明了无产阶级的低微出身。毕竟,培养艺术家和艺术爱好者,是中产阶级以上家庭才可能的事情。
油管在“我给大家听一下什么是赋格”之后插播纯音乐背景的广告,把我吓了一跳,差点颠覆了我对赋格的认知。
AI就像下圍棋, 高端版本只要算力足夠和程式不停優化, 超越人類越對是有可能.
试试这个prompt: piano sonata in A minor in baroque fugue style
需要classical music ai 来满足钢琴fugue和交响乐了
已經有了
计算机写赋格因为有规则的存在应该更容易,但今天大家说的AI通常是指ChatGPT这样的“生成式AI”,它的最弱的项目就是逻辑,比如做小学数学题。所以写赋格很遥远,模仿出“情感”倒是更近一些。
这个软件没有做太多专业定义,博主的词都是在音乐这个context下的,但没有特别告诉AI
你是个非常有趣的人,我每隔一段时间都会集中看几集你的视频,你的视频带给我的是轻松愉快,和认识另一个男人类型,可以说是和我的男人平衡一下吧,我的男人是典型的理工好男人。😂😅😂😅
Midjourney刚开始红火的时候,就有大批的二三流画家出来吐槽,我知道那是他们的哀嚎。suno出来之后,我也是听到不少的哀嚎,当然也有不少人开始探索新的方向。AI势不可挡,面对吧,别当九斤老太了。
只是AI種類問題,每個AI各有專業,有其他AI是專門用古典樂去做大數據,因為古典樂沒有版權問題,是最初AI音樂的發展起點,反而沒有流行歌曲的AI,古典樂的AI早火完了,現在流行樂才跟上。
我不認為古典樂在理論技術上不能實現AI,因為古典樂有更多系統是可複製的,就像數學,影片說的對位法之類,只是這款AI專注流行音樂數據。
但總結都是一樣,要生成時間,要挑選或修改。沒有思想與情感表達(但現在已經有總結出一些情感表達上的技巧,因為每首歌的表達都差不多,只要曲式相同,大家情感表達上的技巧做法都差不多,所以AI反而是做不到特別的異類,而這種異類就是創新)
像媒體行業,有些背景音樂都是公司的音樂庫挑出來的,但比起AI音樂,更好的音樂搜索功能會更實際,因為現在已經有很多免費音樂庫/一次性支付的音樂庫,沒必要AI生成,而且描述命中率低,本身就沒有近年能取代音樂人的可能性。另外開發搜索功能會更實際,但沒有人想做就是,畢竟看著就不吸引,沒有熱誠,沒有社會的免費宣傳。
音樂沒有記憶點我覺得不算是缺點吧,就算是人類創作的曲子也不是每款都能成為家喻戶曉的曲子的。
GPT-2的水平,等GPT-4的水平,要啥给啥
看起来目前主要问题有两个,一个是训练资料不够丰富,再有一个是类别不够细分垂直。但是感觉这都不构成本质的阻碍,相信不久将来就会出来更加完善的版本。
它的交响乐是Yani 那种orchestral 😅
還有 : 如果你真的喜歡創作 , 歌詞你「必須至少」有 30% 是自己填的 !!!!! 退一步你至少你也要提供「5 組關鍵字」, 再由 AI 幫你「加工」, 否則作品就「沒有靈魂」, 也不算是你自己的「製成品」..... AI 是根據你提供的「字」來決定派一首怎樣的歌給你的 !!!!! @@
上次看到你是周杰伦出新专辑,这次是SUNO。解析的很很好,支持!
冯老师,英文应该输入two part invention 试试看。说不定更像巴赫的赋格了。
叨叨老师~看了一半觉得你用song description 是不是用华语写~还是你用华语翻译成英语不够完整形成AI 没有达到你的要求~只是我的疑问毕竟AI资料库多是用英文形成🙏🙏🙏😁😁😁
我猜它training data里大量的是流行乐所以不会写各种genre的。但是很有可能下一步会像stable diffusion一样,出现一些lora或者checkpoint model,专注于某一方面的作曲。我们建筑设计领域目前用ai画图感觉最有用的地方是前期开脑洞的时候。不知道这个对于你们专业音乐人来说,这几个曲子有没有开脑洞功能,能不能帮助你前期创作激发你灵感呢?
做环境背景音乐,电视剧背景气氛音乐足够了。拿下来音质,音源再提升提升即可。
AI迭代速度 今天你瞧不上 明天你追不上😂
使用AI 要学会精准描述要求 如果不好 可以继续反馈给AI 它就会学习 然后改善。 这个才是人机交互的方向