【漢字×ChatGPT】ChatGPTが創った謎の熟語『視覴』とは?【ゆっくり解説】
HTML-код
- Опубликовано: 2 авг 2024
- 最近流行っている「ChatGPT」と歴史の長い「漢字」にこんな接点があったとは!とこの話題を知った時は驚きました。なんだか、どのような視点からでも漢字に関係があると言えそうですよね...漢字の可能性、またChatGPTの可能性が感じられる話題だと個人的には思いました。月日が経つにつれ、漢字の話題というのも進化し、新しい何かが生まれていくのかなあと思うとなんだかワクワクしますね~!
話は変わって、「脱糪」が何と交差したのかわからないと動画内では話していましたが、私なりに色々試してみたところ、「脱輪」の「輪(164, 120, 103)」が交差したのでは?と感じました。(確信はないですけどね...)
ご視聴ありがとうございました!
チャンネル登録・高評価、コメントぜひお願いします!!
リクエストは大歓迎です!!もしリクエストがありましたら以下のURLからお願いいたします!!m(_ _)m
▼リクエストフォーム
forms.gle/Raykbz5Vq13UK7f97
▼今回使ったトークンを調べるサイトはこちら
Tokenizer
platform.openai.com/tokenizer
●主要参考文献・引用
「視覴」の謎-奥村 晴彦-
okumuralab.org/~okumura/misc/...
議諔 (GPT語録)
scrapbox.io/villagepump/%E8%A...)
中國哲學書電子化計劃(ctext.org/ )より一部引用
漢字辞典オンライン(kanji.jitenon.jp/ )より一部引用
『大漢和辞典』より一部引用
●素材
フリーBGM・音楽素材MusMus
musmus.main.jp
効果音ラボ
soundeffect-lab.info/sound/an...
BEIZ images
www.beiz.jp/
CMAN
sozai.cman.jp/
いらすとや
www.irasutoya.com/
pixabay
#漢字
#ゆっくり解説
#解説
#雑学
#ゆっくり
#文字
#中国語
#ChatGPT
#AI
#視覴
#知覘
#脱糪
#複雧
#勤勠記録
#議諔
0:00はじめに(茶番)
0:54本題
4:13にとりの解説!
9:03まとめ
もしこれらが誤って辞書に収録されたら、aiが原因の幽霊語、みたいになりそう
おもろそ()
どこかで感じた事があると思ったらアレだ、
ウトウトと眠りにつく前に謎の言葉やら熟語やらが浮かんでくるあの感覚だ
生成AIは単なるモノマネをしているだけで学習する内容の正当性を判断しない。だからいくら学習しても饒舌な知ったかぶりの域を出ないと思う。
ちょっと話違うけど海外の医学論文ではchatGPTの登場以降"delve"というマイナーな単語の登場頻度が激増したって話があったのを思い出した。
chatGPTやそれに類するAIが言葉の流行りを作っていくようになるかもしれないなあ…
ちなみに、私の弟はbingaiに「ぱんだがしにました」と打ち込んで、AIがそれをネットスラングと処理してた。
意味は聞くたびに代わる。
たとえば、「上野動物園にパンダが来てそのパンダに夢中になってパンダの話しかしない人に対してぱんだがしにましたといい、強引に会話を変える」みたいな意味があった気がする。
じゃあ、トークンが「36735, 248」の漢字も「視」とペアで使われている可能性があるということ...?
[36735, 248] は「聚」ですが、 "視聚" という単語がGPTから生成された形跡はないようです
(Googleで検索してもPDFからの誤抽出らしきものがほとんど)
AIがない言葉を繰り出すのがジワジワと話題に上がってきてるよな
ちょっと前に「ラーメンにお湯をかけて待っている状態」を「ヌードルインサクション」という存在しない連語で返してきたりとかもあった
綴りはnoodle in suctionかな?
Chat GPTで作られた記事を再学習してさらに壊れていくのかな
面白いですねぇ
赤ちゃんが言い間違いをしてるのが
成長するにつれて矯正され
言い間違いしてた頃を懐かしむみたいになる
Chat GPTではないけれど、DeepLにて別日同腹という四字熟語が出てきたってのは聞いたことある。
ゆる言語学ラジオだ!
@@user-dd7dl6mh1hマナーとして一部チャンネル名伏せたほうがいいよ
DeepLだと、「弖紗」なる動詞を発見したことがある。
DeepLあるある→日本語が怪しい
Googleと違ってない単語が表示されるのが尚質悪い
@@Apos_tropheてさ?
曖昧な見た目の記憶から似たような漢字を作り出してしまうミスなら人間はよくやりますが、これはいかにもコンピュータ的な誤字の仕方で面白いですね笑
待ってました!🔥🔥🔥
ありがとうございます!!!m(_ _)m
久し振りの投稿嬉しい
それな
そんな事が起こるのか・・・なかなかに興味深いですね!
(以下微ネタバレの可能性があるので念の為隠しておきます)
動画内に何と交差したかわからない熟語が有りましたが、Tokenizerを使って調べてみると一部の由来がわかった気がしたので残しておきます。(全てはわかりませんでした)
※トークンIDは該当部のみの記述です
脱糪(163, 111, 103)→脱糞(*163, 111*, 252)+脱輪(164, 120, *103*)
複雧(25132, 100)→複雑(*25132*, 239)+複?(?, *100*)
議諔(164, 104, 242)→議論(*164, 104*, 244)+議?(?, 242)
後者2つはわかりませんでしたが、いづれの交差も1文字目の部首と交差後の部首が同じである点が気がかりですね・・・
もしかしたら2文字目にも規則性があるかもしれませんが僕が数十分考えただけでは見つけられませんでした・・・
久しぶりの動画待ってました!!!
編集投稿、お疲れ様です😊
今回の動画もすごく勉強になりました!!
ありがとうございます!!良かったです〜!!m(_ _)m
この現象をAIの欠点とみるのか、創造性と捉えるのかが今後AIと人間の在り方の決め手の一つになりそうな気もします。
私個人としてはどんどん新しい言葉が創造されていくのを見てみたいですね。創造スピードが速すぎるとコミュニケーションには不都合かな?
久々の更新、ありがたいです!!!
漢字が苦手な自分でも楽に見られるので助かってます!
楽に見られるなら良かったです!!とても嬉しいです〜!
めちゃくちゃ面白いじゃないですか!
久しぶり投稿!☺❤
とっても面白い切り口の動画だ。文字コードの話の動画も見てみたいかも。
「諔福」(しゅくふく)
一人で何もしないでいたり
一人で何かをすることに
よって、楽しさなど何らかの
良さを感じたり、幸せな
人生が続いていること。
使い方・用例
「諔福が欲しい。」
「非常に諔福を受けた。」
噓です。
相変わらず面白すぎる。。。
「埴が挫きなら匯違議に竃栖る」ってやつ好き
なんかそれっぽい!
なるほど…全く意味がわからん!(笑)
今の日本語LLMの開発陣はトークン化にも海外製との差別化を狙えると主張できているのかな。
それは別として,将棋のAIどうしを戦わせて新戦法が見つかるように,新語を創出させる狙いで大規模言語モデルどうしを会話させる研究が盛んになると面白そう。既存の単語では簡潔に表しにくい新概念に対応する新語の創出を期待したい。言語つまり文化をまたいで大規模学習できるからこそ発見を期待できるのではなかろうか。知らんけど。
ひっさびさに更新したら霊夢が神に😂
神夢
『AIが作ったコンテンツをAI自身が学習する所為で生成される内容が悪化していく』とよく言われますが、この動画の例を見ると強ちありえなくないですね…
どこで「よく言われ」てるんですか?
@@masterinae AIモデル崩壊 とかで検索
@@masterinae謎の秘密結社
そういえば、登録者九千人おめでとうございます
とても嬉しいです!ありがとうございますm(_ _)m
次は一万人目指して頑張ります!!
面白いテーマだ〜
今のAIには 思考や適切処理が無く 単なる統計処理であることが分かる事例です。
早く見れた!
中国の文献を参照してしまった結果〜とかじゃなくて内部処理の問題でこんなになってたんですねぇ
いくら便利で高度な道具ができても、使う人間がそれをすべて信じるほどバカならあっという間に言語がめちゃくちゃになっていくの、まだ言語だから訂正が効くけど今後活躍の分野が広がるとどうにもならなくなりそうで怖いですね…
色々な熟語で試しましたが、複雧(25132, 100)は複雑(25132, 239)と複座(11795, 100)かもしれません
7:59 少なくとも脱糞と交差してんの最悪すぎて芔
Tokenizerの逆、Detokenizerがあれば存在しない熟語をバンバン生み出せそう(
ニホニウムみたいな作り方
AIが進化する前に「視覴」などの単語があちこちで使われてしまったら、進化したもそこから学習しちゃうので、もう取り消せなくなっちゃいますね。
まあ、これも言語の移り変わりの一種なのでしょう。
正直こういうAI由来の脈絡のない存在が日常に紛れ込んでくるのすっごい寒気するんだけど、時代に置いてかれるのだろうな……
若者の造語と変わらないと思う
@@user-hk3jr1xj7j違うだろ
あと、AI-OCRの読み間違い(と修正忘れ)が定着して言葉ができる可能性があるかも
確かに一回見たことある気がする😂
何て熟語だったかは忘れたけど
ここに挙がってる知覘だったような気もする🤔
ハルシネーションってやつですね
これは面白い
簡体字Verも作られるんやろうなあ。
视𬢔とかですかね
@@atmzprchgakkch
簡体字はかなり省略する傾向あるので
视观とかになるかなあと。
やはり、ChatGPTはそこらの人間より創造性がある
生きとったんかワレェ! おかえり。
ただいま帰りました〜!!!
おもしれぇ😮
こんな熟語聞いたことないって思ったら普通にある熟語だったって言うことはあったんだけどなぁ…。
キターーーーーー(((o(*゚▽゚*)o)))
それっぽいこと言う機械だからな
「せいせいえいあい」って読む四字熟語を存在させたい
この世界から消された概念定期
マキマ「チェンソーマンが食べてしまいました」
伊るやめろ
佐うやめろ
SCP-161-JPじゃねーか!
@@hrsm-chnこの言葉は良く使うし有名でしょ
えっと読み方は…
ん?
ハルシネーションおもろいなぁ
最新バージョンのChat GPTではどうなんだろう
つまりIDを使えば二つの漢字を一つに圧縮できるな?
ポエジーだな?
近未来じゃAI由来の言葉も普通に一般文書で使われてたりするかもね
AIに創られる前にある漢字全部組み合わせて先に熟語全部作っちゃおう
リクエストです。
スマホで出せない漢検一級の漢字の解説
お願いします。
ってことは「視聴覚室」は「視覴覴室」になるのか。
オムニでトークンの切り方変わったけど直ってないの
男女が精子と卵子を合体させて生命を作る様子をイメージしましたね。AIにとってはデジタル世界こそが現実なのでしょう
久々に見て涙が止まらない
ChatGPTの弱点じゃないの?案外中国から漢字圏でのみChatGPTを上回る性能のAIが出てくるかもしれないな
脱腸と脱肛をシンクロさせると何になるの?
解枬したいけど、解枬できない。このゆっくり解枬で、登場した議⚪︎の正体を知りたい。
きたああああああああああああああ
つまり文系の学問ってAIにやらせても大差ないってこと?
意味がわかってしまったのが怖い
個人的に視聴でも視覚でもなく「視覴」っていう気がする
SCPにありそうだな
視→見る 覴→見るであるため熟語のルール意味の重複であるために不成立。チャトなんちゃらはバカだから間違えてもさもありなん
応答、表現、停止、などの上と下の漢字が同じ意味の熟語はルール逸脱だって?
堅固、痕跡、収納、柔軟、創造、飛翔、変換、絵画、増加、暗黒、延長、貯蓄、調査、崩壊、優秀、上昇、利益、
二字熟語の構成なんて義務教育の範囲だったはずなんすけどね