文字コードを深掘りする。文字化けはなぜ起こるのか?【文字コード1】#92

Поделиться
HTML-код
  • Опубликовано: 5 июл 2024
  • 新シリーズ「文字コード」です。「限られた文字しか使えない環境での涙ぐましい努力」「文字コードは自然言語と似ている?」「これ同じ字?違う字?文字コード制定者の苦悩」など、文字コードのおもしろさについて話しました。
    【目次】
    0:00 もしも64種の文字しか書けなかったら…
    3:16 文字化けの原因になる文字コード
    6:44 なぜトカラ列島はカタカナ表記?
    13:17 容量が少なかった時代の工夫
    21:46 文字コードは自然言語に似ている?
    29:34 文字コードの世界では些細な差は一緒
    33:55 文字コードは形よりも情報
    【参考文献】
    ◯プログラマのための文字コード技術入門
    amzn.to/46c6jqf
    ◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼ
    nlab.itmedia.co.jp/nl/article...
    【サポーターコミュニティ加入はこちらから】
    yurugengo.com/support
    【親チャンネル:ゆる言語学ラジオ】
    / @yurugengo
    【実店舗プロジェクト:ゆる学徒カフェ】
    / @yurugakuto
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!
    【お仕事依頼はこちら!】
    info@pedantic.jp
    【堀元見プロフィール】
    慶應義塾大学理工学部卒。専門は情報工学。WEBにコンテンツを作り散らかすことで生計を立てている。現在の主な収入源は「アカデミックに人の悪口を書くnote有料マガジン」。
    Twitter→ / kenhori2
    noteマガジン→note.com/kenhori2/m/m125fc452...
    個人RUclips→ / @kenhorimoto
    【水野太貴プロフィール】
    名古屋大学文学部卒。専門は言語学。
    某大手出版社で編集者として勤務。言語学の知識が本業に活きてるかと思いきや、そうでもない。
    Twitter→ / yuru_mizuno
    【姉妹チャンネル】
    ◯ゆる音楽学ラジオ( / @yuruongaku )
    ◯ゆる民俗学ラジオ ( / @yuruminzoku )
    ◯ゆる天文学ラジオ ( / @yurutenmon )
    ◯ゆる書道学ラジオ ( / @yurushodo )
    ◯ゆる生態学ラジオ ( / @yuruseitai )
    ◯ゆる哲学ラジオ ( / @yurutetsugaku )
    #文字コード #ゆるコンピュータ科学ラジオ_文字コード

Комментарии • 276

  • @yurucom
    @yurucom  9 месяцев назад +15

    【参考文献】
    ◯プログラマのための文字コード技術入門
    amzn.to/46c6jqf
    ◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあ
    nlab.itmedia.co.jp/nl/articles/1801/07/news008.html
    【サポーターコミュニティ加入はこちらから】
    yurugengo.com/support
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!

  • @ihatovoihatovo1732
    @ihatovoihatovo1732 9 месяцев назад +81

    以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。

  • @mudaso-heavy-user
    @mudaso-heavy-user 9 месяцев назад +166

    言語沼の件あってのこのシリーズ、エモい

  • @TonyStark_85
    @TonyStark_85 9 месяцев назад +74

    5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている

    • @nazo_no_message
      @nazo_no_message 9 месяцев назад +12

      その字幕が「nuるっとしちゃう」になってたら300万融資した(ウソ)

    • @1joker141
      @1joker141 9 месяцев назад +10

      nuるnuるPを存在しないって言ったときにnullとかけてるのかなってちょっと思いました

  • @user-ct9sr9id3u
    @user-ct9sr9id3u 9 месяцев назад +46

    ドレミの歌以外で
    「『喇』は『喇叭』の『喇』」って言うことあるんだ

  • @thesaito2721
    @thesaito2721 9 месяцев назад +28

    コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」

  • @184a-xx8km
    @184a-xx8km 9 месяцев назад +42

    15:30
    ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、
    GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。
    ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね

  • @Fnak202
    @Fnak202 9 месяцев назад +94

    初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。
    ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)
    有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。
    また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。
    初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。

    • @subratte256
      @subratte256 8 месяцев назад

      また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)

  • @sabak7390
    @sabak7390 9 месяцев назад +35

    弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。
    智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。
    久しぶりに面白かった脱線話でした。

  • @koi506
    @koi506 9 месяцев назад +38

    昔、フォント作成PJに関わったことがあります。
    文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。
    第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。

  • @yu100nabeyan
    @yu100nabeyan 9 месяцев назад +16

    2人とも緑Tシャツお揃でかわいい

  • @nanaki1006
    @nanaki1006 9 месяцев назад +13

    繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。

  • @magical_hippopotamus
    @magical_hippopotamus 9 месяцев назад +75

    「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。
    文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。

    • @taturou
      @taturou 9 месяцев назад

      サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。

  • @user-we2xe2vv1v
    @user-we2xe2vv1v 9 месяцев назад +27

    ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)
    「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。
    なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。

  • @mudaso-heavy-user
    @mudaso-heavy-user 9 месяцев назад +29

    ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする

    • @masuo64
      @masuo64 9 месяцев назад +6

      むだそすん!

    • @mudaso-heavy-user
      @mudaso-heavy-user 9 месяцев назад +2

      @@masuo64 カタカナの話ね、ひらがなは使えるんやでwww

  • @koolongkoolong
    @koolongkoolong 9 месяцев назад +60

    水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している

    • @haine102
      @haine102 8 месяцев назад +6

      ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。

  • @xitianzhenwu6756
    @xitianzhenwu6756 9 месяцев назад +24

    外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています
    喇叭も同様

  • @nanoriKYDO
    @nanoriKYDO 9 месяцев назад +41

    繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)
    初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか

  • @squandered3589
    @squandered3589 9 месяцев назад +14

    「円マーク円以外に使わんしね」
    元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、
    といったケースがあり、問題になっています。

  • @user-ff7sz4ql5p
    @user-ff7sz4ql5p 9 месяцев назад +5

    瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど
    正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ
    区別するのかなり難しくね?
    弁当は物理的な境や蓋なので瓣かと思いきや辨だし
    弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明
    は一見全部コトバ関係なのに最初と最後だけ辨で違う。
    さらに弁理士や弁償するの弁は
    辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)
    そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。
    一周まわって一緒にしてくれた先人に感謝かもしれん、
    全部バラバラのままだったらきっと自分は発狂してた…

  • @nandemotsukuruyo
    @nandemotsukuruyo 9 месяцев назад +22

    14:55
    ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。

  • @doridoriization
    @doridoriization 9 месяцев назад +86

    難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。

  • @Irix.5674
    @Irix.5674 9 месяцев назад +12

    自分も違いをちゃんとは理解していないから説明ができないんだけど
    文字コードとエンコードは別物なのに混同されて一緒くたに
    扱われることが非常に多い。
    UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。
    UTF-8 は文字コードである Unicode のエンコード方式のひとつ、
    Shift_JIS は文字コードである JIS コードのエンコード方式の
    ひとつです。

  • @user-rp1bv9cn2c
    @user-rp1bv9cn2c 9 месяцев назад +15

    ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。

  • @user-fe3vn9wr1f
    @user-fe3vn9wr1f 9 месяцев назад +23

    パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。

  • @user-wy8nq3js5f
    @user-wy8nq3js5f 9 месяцев назад +12

    Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず

    • @senkobayashi1307
      @senkobayashi1307 9 месяцев назад +4

      ありましたね、単行本のおまけに入っていた気がします

  • @tenrai3065
    @tenrai3065 9 месяцев назад +16

    半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。

    • @Q0rx5kn5oSE
      @Q0rx5kn5oSE 9 месяцев назад +3

      ゆる文字コード学ラジオ待ったなし

  • @user-tq9eg4gg6v
    @user-tq9eg4gg6v 9 месяцев назад +36

    幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?

    • @user-uf5qg4ik5j
      @user-uf5qg4ik5j 9 месяцев назад +4

      Unicodeは、2バイトコードと4バイトコードがある。
      アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。

    • @kumamushi3
      @kumamushi3 8 месяцев назад +1

      予想通りでしたね!

  • @koi506
    @koi506 9 месяцев назад +10

    文字コードが同一でもフォントによって文字が違うことはあり得ます。
    主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。
    ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。
    旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。

  • @fx-702p
    @fx-702p 9 месяцев назад +9

    「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。

  • @tenkawakiirobou
    @tenkawakiirobou 9 месяцев назад

    やっと来た!楽しみに待ってました

  • @maruneko35
    @maruneko35 9 месяцев назад +3

    待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。

  • @mudaso-heavy-user
    @mudaso-heavy-user 9 месяцев назад +13

    楽しみに待ってました

  • @takpon9261
    @takpon9261 9 месяцев назад

    これ期待してた、超待ってた

  • @user-nh9xk1rc8u
    @user-nh9xk1rc8u 9 месяцев назад +32

    ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります

  • @KIKKOMANamawa
    @KIKKOMANamawa 9 месяцев назад +5

    以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが
    「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります

  • @hykathon
    @hykathon 9 месяцев назад

    33:25 サロゲートペアの話への布石ですね。
    こういう伏線を見つけるとワクワクしますね!!

  • @egg24852
    @egg24852 9 месяцев назад +13

    私の年収は¤0です。
    これでうまく誤魔化せたな。

  • @user-vu1ie8jj9s
    @user-vu1ie8jj9s 9 месяцев назад +2

    5:58
    「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん

  • @----___----___----___----___--
    @----___----___----___----___-- 9 месяцев назад +12

    International Organization for Standardization の略ならIOSやろがいと思ってググったら
    明確な由来がなく、私が世界統一した際は滅ぼそうと決めた

    • @francescogatti3002
      @francescogatti3002 9 месяцев назад +1

      iOSが世界を席巻すると未来予知したのかもしれない。

  • @PhodraX4
    @PhodraX4 9 месяцев назад +6

    10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん

    • @Aros417
      @Aros417 8 месяцев назад

      循環参照だ

  • @user-su4bs2eq8w
    @user-su4bs2eq8w 9 месяцев назад +9

    祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した

  • @JackieMatthews610318
    @JackieMatthews610318 9 месяцев назад +1

    32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️
    ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。

  • @user-zj4cv4gy1z
    @user-zj4cv4gy1z 9 месяцев назад +3

    トカラ列島は十島村ですね。
    日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。

    • @user-zj4cv4gy1z
      @user-zj4cv4gy1z 9 месяцев назад

      領域外に役場がある市町村は他にもあった・・・

  • @sissie6843
    @sissie6843 9 месяцев назад

    面白かったです

  • @roadevery9434
    @roadevery9434 9 месяцев назад +4

    さらに合流した弁の字は元々は違う字としてあったと言う話もありますね

  • @Bisco-le1rt
    @Bisco-le1rt 9 месяцев назад +6

    ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」

  • @jyozu
    @jyozu 9 месяцев назад +4

    ファミコンが若い人にも知られていたら、導入で伝えようとしていた
    収録できている文字のイメージがつきやすいんですけどねぇ。

  • @user-dm1ln6uw3q
    @user-dm1ln6uw3q 9 месяцев назад +7

    𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。

  • @furusatonotkokyou
    @furusatonotkokyou 9 месяцев назад +4

    30:11
    常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね

  • @ellnore_pad
    @ellnore_pad 6 месяцев назад

    北海道出身にして現役プログラマーである俺得回。
    そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。
    ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、
    「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。

  • @yoshi46-319
    @yoshi46-319 9 месяцев назад +13

    文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。

    • @user-hq5ei9nx3u
      @user-hq5ei9nx3u 9 месяцев назад

      アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね

    • @masuo64
      @masuo64 9 месяцев назад

      波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。

  • @haine102
    @haine102 8 месяцев назад

    「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。

  • @bicks123
    @bicks123 9 месяцев назад +3

    昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。

  • @ameatokua
    @ameatokua 9 месяцев назад +5

    ゆる言語学ラジオの内容が入ります。 27:1033:49
    水野さんの話が面白いので、聞き入りますね。

  • @TokumeiResearch200X
    @TokumeiResearch200X 8 месяцев назад +2

    最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたね
    あと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある

  • @user-fv8gf8vi5f
    @user-fv8gf8vi5f 9 месяцев назад +9

    文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。

    • @passute
      @passute 9 месяцев назад

      野球好きなら
      李承燁の火へんに華とか
      李机浩の木へんに凡とか
      そういう話かな

    • @_tatibana1243
      @_tatibana1243 7 месяцев назад

      鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。
      鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた

  • @user-og8sd2ei3g
    @user-og8sd2ei3g 9 месяцев назад

    文字コードは文字の話なだけあって、水野さんの引き出しが多いですねえ

  • @atsushigrizlupo8479
    @atsushigrizlupo8479 9 месяцев назад +1

    「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。
    「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。
    ちなみに総務省の包摂基準はけっこう緩いです。

  • @user-of5un8oi9g
    @user-of5un8oi9g 9 месяцев назад +2

    弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。

  • @keisukesugi5085
    @keisukesugi5085 9 месяцев назад +1

    弁のほかにも芸とかも合流してますね

  • @shindy_jp
    @shindy_jp 9 месяцев назад +2

    ペアルックっぽいことに気が取られて内容が頭に入ってこない!

  • @murayan68k
    @murayan68k 9 месяцев назад +6

    ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな

    • @francescogatti3002
      @francescogatti3002 9 месяцев назад +1

      その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。

    • @user-ej4br8gb5v
      @user-ej4br8gb5v 8 месяцев назад

      ASCIIが制定されたのは1963年、
      そのISO版が数年後くらいじゃなかったっけ。
      まだ円が強い時代じゃなかったよ。
      JISコードだと0x5Cに\の代わりに¥が
      割り当てられていていろいろ不便だった。

  • @zr258
    @zr258 9 месяцев назад +2

    データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。

  • @tambaren
    @tambaren 9 месяцев назад +2

    ドラクエの世界で出てくる、アレフガルドという地名は
    パッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない

  • @his58enc8odk310
    @his58enc8odk310 5 месяцев назад

    13とBの話はハガレンで似たような話を扱った回があったな。
    軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ

  • @HigashiJuicy
    @HigashiJuicy 9 месяцев назад +2

    地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。
    標準語にはこの言葉が存在しなくて困る

    • @haine102
      @haine102 8 месяцев назад

      ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな

  • @HashimotoHobbyCh
    @HashimotoHobbyCh 9 месяцев назад

    文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。

  • @user-pi1er7zx3m
    @user-pi1er7zx3m 9 месяцев назад +2

    辯、お前どっかで会ったことあるな…?
    あ、弁髪の弁だ!!と思ったけど弁髪の弁は辮でした。
    誰だお前!!

  • @matano-0419
    @matano-0419 9 месяцев назад +1

    同じような色の服を着ているせいで二人がペアルックに見えて気になって仕方がないw

  • @早川眠人
    @早川眠人 9 месяцев назад +4

    イタリア語話者なら使わないアルファベットがあるから5文字程省ける

  • @user-pi1er7zx3m
    @user-pi1er7zx3m 9 месяцев назад

    13:12 なんだその認識あったのかという驚き

  • @Twilingal
    @Twilingal 9 месяцев назад +1

    「押ささる」は便利

  • @halyur33
    @halyur33 9 месяцев назад +2

    このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーです
    ちなみに道民ですが、【押ささる】は
    ・つい押したくなってしまう
    よりもどちらかというと
    ・(誤って手が触れて)押してしまう
    の方がニュアンスちかいかな~と思ってます

  • @田中舘
    @田中舘 5 месяцев назад

    自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。

  • @user-mj9gx1jg6s
    @user-mj9gx1jg6s 9 месяцев назад +6

    中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。

    • @早川眠人
      @早川眠人 9 месяцев назад +5

      RMBやJPYで明示しましょう

    • @atsushigrizlupo8479
      @atsushigrizlupo8479 9 месяцев назад

      私の年収は¥100万しかありません。

  • @user-qc6zr2uw8x
    @user-qc6zr2uw8x 9 месяцев назад +1

    13:33 認知バイアス辞典101頁にありました!

  • @masakio5367
    @masakio5367 9 месяцев назад

    静岡の薩埵峠もよく「さった峠」と仮名書きされますよね。

  • @kicyoh3390
    @kicyoh3390 9 месяцев назад +1

    いつもモノクロ服なのに、今日どっちも緑なのはなんかの伏線なのか?

  • @moonsnowknight
    @moonsnowknight 11 дней назад

    漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。
    漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。
    しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。

  • @jsuzu
    @jsuzu 9 месяцев назад

    以前コメントでリクエストした話、きた~

  • @tatsutakaraage2662
    @tatsutakaraage2662 9 месяцев назад +15

    6:00 あーここほんと面白いw
    コンビ芸なんよw 円熟味増してるわーw

  • @gunhasirac
    @gunhasirac 8 месяцев назад

    中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った

  • @user-ei8cl1wl3r
    @user-ei8cl1wl3r 9 месяцев назад

    草なぎ(なぎの漢字は弓へんに剪)剛
    っていう表記をニュースの時とかよく見た思い出。ええ、あのニュースとか

  • @haine102
    @haine102 8 месяцев назад +1

    言語が理系っぽくて、文字コードが文系っぽい逆転現象。

  • @h.t3996
    @h.t3996 8 месяцев назад +1

    文字コードって昔からいろんな種類があった。
    半角
     BCDコード→ASCIIコード(Unix、PC)
          →EBCDICコード(IBMなどのメインフレーム)
    全角(日本語独自規格)
     ASCII系→Shift-JIS(PC)、EUC(Unix)
     EBCDIC系→IBM漢字、JEF(富士通)
    世界共通
     UTF-8
    異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。
    初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。
    文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。

    • @michihirokabata2519
      @michihirokabata2519 6 месяцев назад

      昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…
      最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。

  • @user-by9oi7jz3c
    @user-by9oi7jz3c 9 месяцев назад

    昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。

  • @100EIZO
    @100EIZO 9 месяцев назад

    鹿児島県、十島村の悪石島が舞台のルポルタージュ「美女とネズミと神々の島」は名作です。

  • @guranora
    @guranora 8 месяцев назад

    北海道、東北方言の「〜ささる」は大変面白いので是非それで一回やってみてほしいです。文法的には中動態、古典文法における自発の「る、らる」に由来するものだと個人的に推測しています。言語の伝播が同心円状に伝わるということからすると、例えば沖縄にも同じような表現が残っていたりしないでしょうかね

  • @Sola.No.17
    @Sola.No.17 9 месяцев назад +3

    文字コードのドタバタと言えば、ユニコードのハングル大移動だな。

  • @pozo20
    @pozo20 9 месяцев назад +4

    最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか
    漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとか
    は関係ないですね

  • @proebank
    @proebank 9 месяцев назад +1

    偶然自分もほっけTシャツ着てた

  • @user-hs3mk1rg3s
    @user-hs3mk1rg3s 9 месяцев назад

    29:41 肉と宍、裏と裡なんかも同じものみたいな

  • @user-pq2yw7eq5u
    @user-pq2yw7eq5u 8 месяцев назад

    毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...
    人に説明する時は
    「○○さる=○○できる」
    or
    「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)
    「コントローラー握った時にボタン押ささっちゃってさ〜」
    だと
    「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」
    的な感じになります。
    よく使うのは「書かさる(さらない)」
    「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」

    「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」
    「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。
    「洗濯機に服入れる前にボタン押ささった」
    だと、気付かずに押したわけではないんだなという感じがします。逆に
    「洗濯機のボタン押ささんないな」
    だと実際にはポチポチ押しているんだなという感じがします。

  • @subchili
    @subchili 8 месяцев назад

    ISO感度のISOも、国際標準化機構のフィルムの規格からだったような

  • @tayashoki1831
    @tayashoki1831 9 месяцев назад +5

    弁護士の辨
    弁理士の辯
    花弁の 瓣
    中国語では簡体字にするときに纏められたりもせず、それぞれ存在し続けているようです

  • @tekoku3
    @tekoku3 9 месяцев назад +1

    オタクなので黙示録の喇叭とかで喇は知ってたりする

  • @shotamatsumoto3037
    @shotamatsumoto3037 8 месяцев назад

    SEとしてはNull Null(ヌルヌル)でいいね
    Null だけでぬるもなるも代用できる

  • @tatsuaki.takahashi
    @tatsuaki.takahashi 9 месяцев назад +3

    Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん

  • @mudaso-heavy-user
    @mudaso-heavy-user 9 месяцев назад +4

    6:02 nuるっとしちゃう