近年はアルファベットも取り入れてるからなぁ
ネイティブがいない学びはほぼ必ず「読み書き」から入り、その場合日本語は多分世界で最も習得が難しい言語の一つだろうし、学びそのもののメタ的理解を持ってないとこの質問は出来ないだろう。頭良すぎてすごい
日本語以外にも似たような構造を持っている言語はないのかしら。
漢文・古文・英語を勉強したことが、現代の日本語(文法・構造)を理解することに役立った気がする。海外の、抽象的、発音のし易さ、新しいモノなどに適応・取り込みするために日本語が持っている構造なのだろう。
その辺は言語学者がちゃんと分類しているだろう。
『外国語そのもの』だったから、文字は言葉を記述するものだという固定概念にならなかったんだろうなと思う。『音を記述できる』『意味を日本語で読み上げる事ができる』という2つの発明が必要だったはず
ファンタジーのドラゴン語には一語にたくさんの意味が含まれている、なんて設定があったりしたが、それに近いものを感じたのかな。
漢字の表意機能?が優秀過ぎる。英語は多少読めるけど、まず訳したのを読んで必要に応じて元を参照するのが一番効率がいい。
分かる。日本語は縦読みが出来るけど英語だと出来ないんだよな
これ観点が面白いよね。あってるかどうかは別として。/言葉による表現に限界があることを自認した言語って気はする。特に和語。
日常で使ってる文字の数がやたらと多いよね
純粋に表記に関しては逆じゃないのかな。表音文字による記述は情報を引き伸ばしてるんであって、脳内で理解するには1単語まで圧縮する必要があるんじゃ?
なんか生成AIぽいなぁ。質問で箇条書きしてくれるありがたみよ
逆説的に日本人が英語をはじめとした他言語を苦手な理由だね
例えば鬼滅の刃は鬼を絶滅させるという強い決意が含まれるし刃は鬼殺隊という組織のことであり日輪刀のことでもあり牙を剥くという意志も含まれる。英訳のデーモンスレイヤーじゃそういった思想が全く表現できない
逆。まず口語がありそれに大陸から入ってきた漢字で当て字をしていった。なのでコミュニケーションの為の言語だよ
中国語の方が圧縮すごいだろ
出典が探せないが、英字新聞と日本語の新聞を見せて意味把握する実験で、日本語の方が短時間で読み取れるという結果が得られた話を聞いた憶えがある。
民明書房刊『日本語の変遷と情報の誤謬』を読めば分かると思います
日本語の情報圧縮力に気づくとは。漢字一文字に意味詰め込みすぎ問題
ヨーロッパは地続きで各国似たような言葉があるけど、日本は島国でイギリスみたいに外に出るのではなく内に籠るばかりだったから文化を拡げるより取り入れる形になったんかもなぁ
偽中国語是日本的真正情報圧縮機構
『漢字と日本人』を読まう
“ひらがなはやわらかさを作る。 カタカナは距離や異物感を作る。 漢字は意味の密度を上げる。”
日本語話者は「摩擦を避ける(或いは増大する)言語利用の予期システムを使ってる。このため圧縮も伸長も行う」場での言語利用の異なりは成長とともに場をこなすことで学ぶ。しかしコレらは動的に異なる。
日本語に限った話だろうか
これはかな漢字混合の見た目だけの話をしてるの?文法的なことは考えてない?中国語は素で倒置法なんだよね。
言語学どころか英語もその他外国語の一つもロクにわからないような人が独自理論で日本スゲーするんだろうなと思って読めなかった
我謝謝茄子
「記録を残し保持しそれを報告し第三者に検証可能にしその結果に責任を持つ」という長いプロセスがaccountability の一語に圧縮されているようにどの言語でもそんなもんたくさんある
輸入漢語にあとから表音文字の仮名をくっつけたが、その後も文語と口語はかなり違っていた。書き文字自体が情報圧縮の性格が強く、中々に解ってる指摘
平安時代の女房の文章、戦国時代の武将の文章、江戸時代の町人の文章とかも読んだら面白いと思うな。さすがに崩し字はキツいから、翻字した釈文でいいので。現代日本語とはかなり文字表記の思想が違う。
仮に圧縮が高くて高度な思考が短時間でできてもね……それは可能だというだけでね……「腹減った、ヤベ、屁が出る」みたいなのが高圧縮で効率的に漏れ出るだけで、高度な思考が出るかは別になんだよね……
平安時代の和歌も、ダジャレ的な2つの意味をもつ言葉で圧縮してるもんな… 英語の歌詞を日本語に訳してもそんなに違和感はないけど、前前前世の英語版で「そ、そんな直接的な事を…?!」ってなった事ある
上手いこと言わはる。「情報圧縮システム」や「思考のプロトコル」って中々出てこない言葉かも。でも日本人は日本語に限らず読み書き堪能なら言語全般を、字面から意味や雰囲気を読み取るものと捉えてると思う。
個人の感想を体系的に言うほど独自性が感じられ少なくない人数の興味にあったのでしょうね。全ての言語がそうだったとしても他例は海を越えて変質をまとめきれず感想を共有できる数と勢いが満たなかったのかも。
日本語はInferenceとresoningがどっちも推論で区別できないクソ言語です。 じゃあインファレンス、リーズニングと言い分ければ良いじゃん、日本語すごいじゃん。 そうすると横文字警察が来るからやっぱりクソ言語です。
面白い考察。誰か本にまとめて!(もうあるのかな)/AIによる翻訳で作られ、流通する日本語のほうが人間によって作られるものより増えることで日本語が変わっていったりするだろうか。
生成AIに回答させたような投稿があるな…元の質問からほとんど情報増えてない感じの。
日本語はハイコンテクストで共有されている前提は書かない(しゃべらない)ので、書いてないことが分かるようになったら雰囲気が理解できるといえるな。凄い面倒なこと言っている気がするが。
表意文字としての漢字に加えて、同義でも漢字かなカナの使い分けにニュアンスが生まれるのは、確かに非ネイティブには「圧縮」になるのかもしれない。おもしろいなー。
このナイジェリア人、ただ者ではない。高名な言語学者か?
慧眼。日本人にとっては自明すぎて気づいていない。
頭の良い人だな、これに気付くとは…
”日本語は「完成させる言語」なのでしょうか? それとも「意図的に不完全さを残す言語」なのでしょうか?”この質問ができることに関心してしまった。
歴史的には当初言葉に漢字を当てていたのが読み書きが大変だから平仮名や片仮名が生まれたという流れらしい。片仮名はほぼ英語の置き換えになってるけど https://www.futurelearn.com/info/courses/japanese-rare-books-culture-j/0/steps/96495
母語だからって詳しいわけじゃないんだけど、なんかアンケートに回答すること自体の報酬系から瞬発力で言いたくなる人があぶり出されるやつ。専門家が出てきて初めて意味のある話だと思う
ナイジェリアの方がこのように日本語に関心を寄せてくれたのは良いとして、それを受け止めている日本人側のリアクションが痛くて読めなかった…
漢字オンリーの中国・台湾の方が情報圧縮率は高いので話がずれてる。むしろ問題はなぜ表音文字と表意文字が混在しているか。
『強烈に面白い問題提起』書いてて寒くなんないのかな
zipでくれ
漢字の圧縮率が異常なんだよな。偽中国語で意思疎通可能だし
LLMで作った回答って価値なしと見做して私は読み飛ばすんだなという学びがあった/LLMでSNSやるのって何が楽しいんだろ。ロボットに自分の代わりに遊ばせてるみたいな謎の遊戯だ
面白い考えだな。
プロトコルの意味がわからんけどプエルトリコをいつも連想する。これも日本語の持つ魔力か?あるいはオヤジギャグ脳か?
日本語は速読に向いてる言語、ってのは前聞いたことある。他の言事比べてぱっと見で意味を理解しやすい。小説に対する漫画みたいな感じ。
「被爆者」と「ヒバクシャ」の違いは外国の日本語学習者には分かりづらいだろうな。日本人でも明確に言語化できる人はあまりいない。
日本語というプロトコルの言語で実装された日本人という人型ロボットは、どのように振る舞い、どのように他のプロトコルで動く人型ロボットと協調、闘争をするのか?
漢字のおかげだわな。助詞は便利だと思うけど。
“「思考のプロトコル」というアイデアには深く同意する。すべての言語はそれぞれ固有の思考プロトコルを有すると思う。”SVOもちゃんと説明されるとなるほどだしね。主語がサブジェクトって何でだよってなるよ。
個人がもってる「アーカイバー」の微妙な差が、厳密な理解の共有を妨げる言語でもある。多文字言語と音素文字言語を両方使えるようになるのがベスト。
この人たぶん日本人向けバズを狙ったAIのアカウントじゃないかな。立て続けに似たような興味をそそる様なポストしてるし。
ちょっと何いってるかわからない
漢字凄いってだけだけどな。中国語の圧縮力は極めて高い。高すぎて少しの発音のブレが致命的になるから音楽MVは漏れなく字幕付きになるけど
非常に興味深い。トニー・ラズロ氏が「日本語の『ん』は15(だっけ?)種類・発音の『ん』がある」と言ってて愕然としたがこの人も異言語話者だからこその視点。だから日本人でも日本語理解が不十分な人が多いのだよ
表意文字使ってるからな。でも中国パイセンには敵わん。表意文字と表音文字をちゃんぽんで使ってるのは中国パイセンから見たら頭おかしいと思われてるだろうか。
仏教伝来で中国語翻訳、黒船来航から英語翻訳のためにカスタマイズされてきた結果が今現在なのでこういう解釈は腑に落ちる。もし丸山圭三郎が生きてたらどんな感想になるのかなあ。
どんな言語にも文法外の文化コンテクストはあるし無意識に情報圧縮がされる。日本語はその割合が高いというのはそうなのかもしれないけど。
「単なるホニャララではなく論理的な構造体」みたいなフランス哲学構文が人を喜ばせる例。「日本語は」とつくと食いつき百倍
はいはい日本語すごい日本語すごい
多言語の文化に言及なんてまるで出来ないけど、日本語は難易度が高いのと同時にユーモアと優しさを感じる。寄り添いと改善大好きだし...ツンデレだ。第4の文字「絵文字」もすぐ作れるような柔軟な開発環境なのかな。
中国語は音だけを当てた漢字を多く含むので、漢字の意味をヒントにできない。日本語の漢字にも表音文字はあるが、 1 ページをザッと見て読まずに内容が大体分かるのはひらがなカタカナのおかげだと思う
そういうのを表す英語がニュアンスなのかな
単語間の繋がり確率を学習しただけのLLMが思考力を持つ如く文章を出力してるのだから言語が思考のプロトコルなのは間違いなさげ。ただし日本語には限定されない。主語を略すのが曖昧なら屈折語も同様だろ。英語が特殊
ナイジェリア語は文字の言語で、情報が展開されているのだろうか
サピアウォーフの仮説はほぼほぼ否定されてるが特定の構造物に対する認知プロセスの変化はあるからそれの体感だね
漢字がそういうことかな
別でブクマに上がってた森博嗣さんのエッセイでは英語の方が工学的に思考しやすいって言ってたね。日本語は情緒的すぎて設計がはっきりしないみたいな。
長文のポスト、全部AIが書いてるように見える(病)
単に表意文字と表音文字の違い。表意文字の圧縮率は高い。絵文字はもっと圧縮率は高い。
https://x.com/masayasan201911/status/2048406538835132763 まとめに入ってないけど日本よりもナイジェリアに近いアッカド文明もシュメール語の語・文字を借用してちゃんぽんで書いてたんだそうな
最終的に空気を読む・・・まで言うしなぁ。多層化されたレイヤーと感じる、というのは日本人には思いもしない視点だ
そういう意味では英語等のアルファベット言語は単なる文字の言語だよなぁとつくづく思う。でも、日本は文字を持たなかったので、模倣から始まってるんよね。全ての元祖は漢字。
ぜんぜんわからない。俺たちは雰囲気で日本語を使っている。
すべての言語がそうとしか。むしろ話者の少ない言語ほどそうじゃないかな。
だいたい藤原定家のせいですよ。
"ひらがなは音を運ぶ流れる骨格のように感じられます。 カタカナは外来要素を取り込む翻訳ツールのように機能しているように思えます。 漢字は意味を一瞬で圧縮するデータパケットのように感じられます"
トップブコメ、中国語の方が圧縮率高いのはその通りだけど、ひらがなとカタカナという表音文字を組み合わせて使ってることが、「解凍」を感じさせるのだと思うよ
【𰻞𰻞麺】ビャンビャンメンはめっちゃ圧縮してそうで何も圧縮してない
生活様式がある程度同じであるという条件も必要だったように思うんだよね。だから同じ言葉で推測されるものや価値観が近いと、より精度が高くなる。
知性の塊のような質問内容。どのような回答をするか考えるだけでも視点が上がる気がする。
まあ多系統の文字種が混在して互いに淘汰されなかったというのは珍しいのかも。個人的にはもっとアホみたいな数の文字種が作られては消えて最終的に3つだけ残った説を推したい。
視点はなかなか面白かったけど、まとめられているポストはざっとしか見てないけど、なんら面白くない。残念/展開が必要な圧縮はしてないですね。別単語にする方法が漢字変更なだけ。
多かれ少なかれどの言語も情報圧縮システムなんじゃないのん?
しゅごい…日本しゅごいぃぃ(失禁)……こうですか?わかりません!
意味が分からないなりにカタカナでそのまま流通できるのは便利
非日本語話者の同僚の文章を頻繁にみてるけど、併せて立場の違いや語彙の選択や漢字か仮名を選ぶかで相手の温度感を推し量る方法を伝えて、成程たしかに難しいなと。
日本のYouTubeサムネが「文字」だらけになるのは文字の情報密度が高いからだと思う。欧米圏はまずビジュアルで内容表現し文字で補足って感じ。日本人はビジュアルと文字の役割の違いすら意識してないよね
たぶん作者の人そこまで考えてないと思うよ
"LGTM"みたいな略語もかなり圧縮されているが、記号混ぜても高々30^nパターンしかないので衝突しそう。LGTMに関しては「いいね」のほうが
中国語系はカタカナがないから外来語ももれなく当て字なので、瞬時に判断できる利点はあるかなぁと思う。ひらがなと漢字の区別はなんでできたんですかね。ひらがなって元々漢字じゃなかったっけ?
俺は日本語しか理解できないから他言語との比較ができない。だからブコメのデモンスレイヤーもダサッとしか思わないけど、「刃」みたいな含みを「Slayer」が持ちえないとは断言できないんだよね。本当にそうなの?
元々ひらがなの流れがあって意味の強いところを漢字にしたならその通りだけど、歴史的には逆で意味の弱いところを面倒くさが効率化して変体仮名→かなとくずしていったので、圧縮はちょっと違うような
問題提起は鋭いと思うが「情報圧縮」や「多層的意味」は文字体系の話に留まらず、もっと深く日本語文化に根ざしていると思う。平安時代から、意図的な意味の圧縮は娯楽でさえあったはず(掛詞・本歌取り・見立て)
漢字(表意文字)の優位性というのは感じていたけれど、送り仮名で読みや意味の違いが判別しやすいとか、カタカナで外来語を示すとか、確かにそれだけじゃないよね。他言語を知らないので独自性の程は分からんけど。
「思考のスピード」は変わっていたと思います。漢字かな変換して、送り仮名を調整し、時に、カナにしてローマ字・英語・ドイツ語・オランダ語。フリガナつけたりして。絵文字に顔文字。全然圧縮なんかないぞ
ベトナムも韓国も漢字捨てちゃったのは勿体無いよなぁ
日本語に限らず母語話者は一つ一つの文字や単語は追わずに形を画像のように瞬時に判断していると思うが、文字種が多く漢字を含めると膨大な日本語は表現力が高く、学習者にとっては大きな壁になるんだろうな。
この考察は言語とレアリアが混ざってしまっている。まずそこを分けて考えるようにしたい。
文法法則に収まらず「文脈で判断」するケースはどの言語にもある。ヘブライ語は表記文字が基本的に子音のみで、母音は文脈で読むんだぞ。難しすぎるだろ。(聖書は誤読を防ぐために母音記号を振る)
巧妙に隠された日本スゲー。なんか読んでて恥ずかしいんだよな。
「文脈」というエンコーダー兼デコーダー
「三十一文字」なんて文化がある時点で,単位文字あたりの情報量が膨大であることは自明。
LLMよくわかってなかった頃は日本語のほうがバイトあたりの情報量が多いので、思考力が上がるのではと思ったけど、あとから英語でもトークナイズしてるから別に関係ないと知った
古来書き文字は漢字だけで表記されていたのが、ひらがなを交えるようになって文学に広がりが出た(仮名文学)みたいなのは学校で習うと思うんだけど。
日本語に主語はいらない
Xで見たときに、初見で面白い質問だなと思った。自分が使っている言語を第三者目線で考えることはまず無いからな~
フス・ロ・ダー!
とっくに言語学で分類されとろうが、圧縮は中国語のおかげで、ひらがな・カタカナ加えていいとこ取りな反面かなりの文字数を覚えないといけないわけで母語じゃないとなかなかに習得が厳しい言語な気はする。
今AIで流行りのマルチモーダルじゃん。だからまんが生成の精度もあがってきてんのかな。でも逆に高度で精密には向いていないという性質がより明らかになるような・・・
シンプルに万葉集とかの短い言葉からそこに含まれるさまざまな情景を思い浮かべる技術が古来からあったからそれが現代まで続いてるんじゃないのか?めんどくさいけど
主語を省略可能だったりいくらでも文法を破ったりしてもいいとことか空気を圧縮した言語という感じはする、整った文章は漢字だけ読めば意味理解は可能だし
この曖昧さ問題が法律文書とか設計書、仕様書には不適なのよね。文字種による圧縮と文法も省略ができる
どの言語も思考プロトコルじゃないか
メッセージ (映画)
言語の由来でどこが端折られるか変わるしなあ、雰囲気そのものの理解は自国言語以外で苦労するのは普通だろうしネイティブしかわからん
一方で南北朝鮮では漢字を捨てており、おそらく表意的効果よりも文字数節約効果の方が大きいのだろうな、と思う。『まいらせ候』みたいなもの。訓読みの勝利。カタカナ語に略語が多いのも同様の理由か。
表意文字の文化圏は圧縮してなんぼな所はあるよな。
圧縮言語といえばシャバドゥビタッチヘンシーンシャバドゥビタッチヘンシーン
中国語は漢字だけだから圧縮率は高いけどそれだけ。日本語の独自性はカタカナで外来語をそのまま取り込めることと、ひらがなによる接続で「ぱっと見」の可読性が高くて情報量が多いんだよね。頭のいいナイジェリア人
漢詩とかすごいよね圧縮 ナルトダンスの日本語訳が長くておもろい
空気ね、圧縮解凍プロトコルね
漢字で書くか、一部ひらがなにするか、全部ひらがなにするか、カタカナで書くかで込められた意味が変わるのもあるな
ワビサビを粋と感じる文化も影響してるのかな
ナイジェリアで日本語学習者と交流する日本人には思慮深い人が多いのでないか(適当)
情報理論でいうエントロピーが変化しない(と思っている)部分は省略されがちかもな。逆に省略されたということは…という思考もある。プロトコルといわれればそうかもね。
“日本語は単に「読む」ものではなく、「理解しながら展開(解凍)する」言語なのではないか、ということです。”←最終的には空気を読むに尽きる
葬送のフリーレンのタイトル回収のリュグナーの台詞を、スレイヤーとしか訳せない件をなんとなく思い出したり。英単語にもそういうダブルミーニングな単語があるのかな。
表音文字の人たちから見ると圧縮システムに見えるのはそうだろうな。140字の制限を苦にせず普及したのもその点が大きい。
すべての言葉は情報圧縮システムであり、文化的背景の違いからくる多くの含意がそれぞれの言葉にはある。読む側が文脈から解釈するのも当たりまえ。なぜ日本だけが特殊だと思いたがるのか不思議。
母語話者がそんなのわかるわけないじゃん。雰囲気でできるようになってんだから。
「ナイジェリア」って外国からの興味に過剰反応しているだけでは?どのへんが「ナイジェリアから見て」なのか分からんし特に中身があるとは思えない。返信も「日本スゴイ→俺スゴイ」勢がAI使って悦にいってるだけ
漢字みたいに意味を持つ文字と、かなカナみたいに音しか表せない文字が、緩急つけてヒラヒラしてて良いよね
表意文字と表音文字を混合して使ってるので、それぞれの良いとこ取りができてるのかな。文字の種類が多いから色んな形での言葉遊びをしやすい言語だと思う
圧縮率では中国語が圧倒的だけどな。この辺は素人の雰囲気で語るのではなくて識者の見解を聞きたいところ。
英語は静的言語であり、日本語は受け手が解釈する動的言語なんだとラリーウォールも言ってたよ インタプリタが悪いと伝わらないのも同じだね(たぶん文字数が少ない=圧縮という話ではない)
日本語は感情表現に優れていると思う。尊敬語や謙譲語、多様な三人称、語尾の使い分け等々。文章だけでその人がどういう感情を持ってるかが表現できる。英語はできないからボディランゲージで表現する
元々、奈良時代に輸入したのは中国語で、表記に必要な漢字を日本語に取り込む際に、訓読みやカナの発明で意味が詰まった漢字を展開して日本語として読むようになったからだろ。
大陸系と島国系という対比を良くするが環境による文化背景です。大陸は明確にし線引きを、島国系は曖昧にし角を立てない。プロトコルの共有による前提部の未記述な省略形の言語。だけど前提の共有が細分化してる現状
言語体系がすでにあるところに、表意文字である漢字や外来語を輸入したからだろ。民族が言語でわかれてなかったのも大きいかもな
“ひらがな・カタカナ・漢字の混在は今では、それぞれが特定の役割を持った設計構造のように見えます。日本語の文字体系は、「音 文法 意味 由来 ニュアンス」を、画面上で同時にレイヤー表示”
日本語は元々無文字言語として出発したが、後に漢字を輸入し、その意味と音の両方を利用して記述されるようになった。そのうち主に音の側面を利用したのが仮名。要するに元は全部漢字。
単に漢字の情報圧縮率が高いだけ。イーロンマスクもそんなこといってた。Xの文字数制限下なら中国語の方が情報多い(漢字ひらがなハングルはXでは2文字カウント)。適当言って日本スゲーするアカウントが恥ずかしい
中国語を勉強していて思ったけど、けっこう日本語って発音がテキトーでも通じそうなイメージある
日本には四季があるから…
AI君に漢字以外の表意文字を使う言語があるのか聞いてみたけど、現代で一定以上の規模で使われているのは漢字だけらしい。
文字のコミュニケーションや小説等において、漢字の言葉を敢えてひらがな・カタカナで書いて違いを出したり、さらにはルビで表現を多重化したり(厨二的なやつ)、単なる圧縮ではない面白さがあるね。
アメリカでは言語以外に身振り手振りや表情も使って雰囲気を伝えているが、日本は日本語だけで雰囲気を伝えられるから身振り手振りや表情などが少ないのだろうか
このナイジェリアの方の知性すごいな。
日本語は「察しろ」圧が強くてオヌヌメの言語ではない
ひらがなだけでも文章は書け、知っている漢字を加えていけば読みやすくなる。ふりがながあれば知らない漢字も読めるため、段階的に学びやすく、識字率が上がりやすい言語だと思う。
言語はすべて情報圧縮システム。そのなかで日本語が特筆すべきなのかはよくわからない。複数の文字を組み合わせて使用し、同じ単語、同じ読み方でも書き方が複数あるのは特徴的だとは思う。
日本語側から見ると、英語は音情報を圧縮している言語に思える。例:「フランス」は4音、”France”は1音。英語で書かれた歌をそのままの拍で日本語に翻訳すると間の抜けた歌になってしまう。
“ひらがなは音を運ぶ流れる骨格のように感じられます。 カタカナは外来要素を取り込む翻訳ツールのように機能しているように思えます。 漢字は意味を一瞬で圧縮するデータパケットのように感じられます。”
情報の圧縮は概ね感じのお陰だと思うが、表音文字と表意文字を都合によって使い分けられるのは便利。しかもカタカナで書くとニュアンスが変わるという便利さもある
ナイジェリアから質問 『日本語は単なる「文字の言語」でなく、一種の「情報圧縮システム」のように感じるようになりました。』
近年はアルファベットも取り入れてるからなぁ
ネイティブがいない学びはほぼ必ず「読み書き」から入り、その場合日本語は多分世界で最も習得が難しい言語の一つだろうし、学びそのもののメタ的理解を持ってないとこの質問は出来ないだろう。頭良すぎてすごい
日本語以外にも似たような構造を持っている言語はないのかしら。
漢文・古文・英語を勉強したことが、現代の日本語(文法・構造)を理解することに役立った気がする。海外の、抽象的、発音のし易さ、新しいモノなどに適応・取り込みするために日本語が持っている構造なのだろう。
その辺は言語学者がちゃんと分類しているだろう。
『外国語そのもの』だったから、文字は言葉を記述するものだという固定概念にならなかったんだろうなと思う。『音を記述できる』『意味を日本語で読み上げる事ができる』という2つの発明が必要だったはず
ファンタジーのドラゴン語には一語にたくさんの意味が含まれている、なんて設定があったりしたが、それに近いものを感じたのかな。
漢字の表意機能?が優秀過ぎる。英語は多少読めるけど、まず訳したのを読んで必要に応じて元を参照するのが一番効率がいい。
分かる。日本語は縦読みが出来るけど英語だと出来ないんだよな
これ観点が面白いよね。あってるかどうかは別として。/言葉による表現に限界があることを自認した言語って気はする。特に和語。
日常で使ってる文字の数がやたらと多いよね
純粋に表記に関しては逆じゃないのかな。表音文字による記述は情報を引き伸ばしてるんであって、脳内で理解するには1単語まで圧縮する必要があるんじゃ?
なんか生成AIぽいなぁ。質問で箇条書きしてくれるありがたみよ
逆説的に日本人が英語をはじめとした他言語を苦手な理由だね
例えば鬼滅の刃は鬼を絶滅させるという強い決意が含まれるし刃は鬼殺隊という組織のことであり日輪刀のことでもあり牙を剥くという意志も含まれる。英訳のデーモンスレイヤーじゃそういった思想が全く表現できない
逆。まず口語がありそれに大陸から入ってきた漢字で当て字をしていった。なのでコミュニケーションの為の言語だよ
中国語の方が圧縮すごいだろ
出典が探せないが、英字新聞と日本語の新聞を見せて意味把握する実験で、日本語の方が短時間で読み取れるという結果が得られた話を聞いた憶えがある。
民明書房刊『日本語の変遷と情報の誤謬』を読めば分かると思います
日本語の情報圧縮力に気づくとは。漢字一文字に意味詰め込みすぎ問題
ヨーロッパは地続きで各国似たような言葉があるけど、日本は島国でイギリスみたいに外に出るのではなく内に籠るばかりだったから文化を拡げるより取り入れる形になったんかもなぁ
偽中国語是日本的真正情報圧縮機構
『漢字と日本人』を読まう
“ひらがなはやわらかさを作る。 カタカナは距離や異物感を作る。 漢字は意味の密度を上げる。”
日本語話者は「摩擦を避ける(或いは増大する)言語利用の予期システムを使ってる。このため圧縮も伸長も行う」場での言語利用の異なりは成長とともに場をこなすことで学ぶ。しかしコレらは動的に異なる。
日本語に限った話だろうか
これはかな漢字混合の見た目だけの話をしてるの?文法的なことは考えてない?中国語は素で倒置法なんだよね。
言語学どころか英語もその他外国語の一つもロクにわからないような人が独自理論で日本スゲーするんだろうなと思って読めなかった
我謝謝茄子
「記録を残し保持しそれを報告し第三者に検証可能にしその結果に責任を持つ」という長いプロセスがaccountability の一語に圧縮されているようにどの言語でもそんなもんたくさんある
輸入漢語にあとから表音文字の仮名をくっつけたが、その後も文語と口語はかなり違っていた。書き文字自体が情報圧縮の性格が強く、中々に解ってる指摘
平安時代の女房の文章、戦国時代の武将の文章、江戸時代の町人の文章とかも読んだら面白いと思うな。さすがに崩し字はキツいから、翻字した釈文でいいので。現代日本語とはかなり文字表記の思想が違う。
仮に圧縮が高くて高度な思考が短時間でできてもね……それは可能だというだけでね……「腹減った、ヤベ、屁が出る」みたいなのが高圧縮で効率的に漏れ出るだけで、高度な思考が出るかは別になんだよね……
平安時代の和歌も、ダジャレ的な2つの意味をもつ言葉で圧縮してるもんな… 英語の歌詞を日本語に訳してもそんなに違和感はないけど、前前前世の英語版で「そ、そんな直接的な事を…?!」ってなった事ある
上手いこと言わはる。「情報圧縮システム」や「思考のプロトコル」って中々出てこない言葉かも。でも日本人は日本語に限らず読み書き堪能なら言語全般を、字面から意味や雰囲気を読み取るものと捉えてると思う。
個人の感想を体系的に言うほど独自性が感じられ少なくない人数の興味にあったのでしょうね。全ての言語がそうだったとしても他例は海を越えて変質をまとめきれず感想を共有できる数と勢いが満たなかったのかも。
日本語はInferenceとresoningがどっちも推論で区別できないクソ言語です。 じゃあインファレンス、リーズニングと言い分ければ良いじゃん、日本語すごいじゃん。 そうすると横文字警察が来るからやっぱりクソ言語です。
面白い考察。誰か本にまとめて!(もうあるのかな)/AIによる翻訳で作られ、流通する日本語のほうが人間によって作られるものより増えることで日本語が変わっていったりするだろうか。
生成AIに回答させたような投稿があるな…元の質問からほとんど情報増えてない感じの。
日本語はハイコンテクストで共有されている前提は書かない(しゃべらない)ので、書いてないことが分かるようになったら雰囲気が理解できるといえるな。凄い面倒なこと言っている気がするが。
表意文字としての漢字に加えて、同義でも漢字かなカナの使い分けにニュアンスが生まれるのは、確かに非ネイティブには「圧縮」になるのかもしれない。おもしろいなー。
このナイジェリア人、ただ者ではない。高名な言語学者か?
慧眼。日本人にとっては自明すぎて気づいていない。
頭の良い人だな、これに気付くとは…
”日本語は「完成させる言語」なのでしょうか? それとも「意図的に不完全さを残す言語」なのでしょうか?”この質問ができることに関心してしまった。
歴史的には当初言葉に漢字を当てていたのが読み書きが大変だから平仮名や片仮名が生まれたという流れらしい。片仮名はほぼ英語の置き換えになってるけど https://www.futurelearn.com/info/courses/japanese-rare-books-culture-j/0/steps/96495
母語だからって詳しいわけじゃないんだけど、なんかアンケートに回答すること自体の報酬系から瞬発力で言いたくなる人があぶり出されるやつ。専門家が出てきて初めて意味のある話だと思う
ナイジェリアの方がこのように日本語に関心を寄せてくれたのは良いとして、それを受け止めている日本人側のリアクションが痛くて読めなかった…
漢字オンリーの中国・台湾の方が情報圧縮率は高いので話がずれてる。むしろ問題はなぜ表音文字と表意文字が混在しているか。
『強烈に面白い問題提起』書いてて寒くなんないのかな
zipでくれ
漢字の圧縮率が異常なんだよな。偽中国語で意思疎通可能だし
LLMで作った回答って価値なしと見做して私は読み飛ばすんだなという学びがあった/LLMでSNSやるのって何が楽しいんだろ。ロボットに自分の代わりに遊ばせてるみたいな謎の遊戯だ
面白い考えだな。
プロトコルの意味がわからんけどプエルトリコをいつも連想する。これも日本語の持つ魔力か?あるいはオヤジギャグ脳か?
日本語は速読に向いてる言語、ってのは前聞いたことある。他の言事比べてぱっと見で意味を理解しやすい。小説に対する漫画みたいな感じ。
「被爆者」と「ヒバクシャ」の違いは外国の日本語学習者には分かりづらいだろうな。日本人でも明確に言語化できる人はあまりいない。
日本語というプロトコルの言語で実装された日本人という人型ロボットは、どのように振る舞い、どのように他のプロトコルで動く人型ロボットと協調、闘争をするのか?
漢字のおかげだわな。助詞は便利だと思うけど。
“「思考のプロトコル」というアイデアには深く同意する。すべての言語はそれぞれ固有の思考プロトコルを有すると思う。”SVOもちゃんと説明されるとなるほどだしね。主語がサブジェクトって何でだよってなるよ。
個人がもってる「アーカイバー」の微妙な差が、厳密な理解の共有を妨げる言語でもある。多文字言語と音素文字言語を両方使えるようになるのがベスト。
この人たぶん日本人向けバズを狙ったAIのアカウントじゃないかな。立て続けに似たような興味をそそる様なポストしてるし。
ちょっと何いってるかわからない
漢字凄いってだけだけどな。中国語の圧縮力は極めて高い。高すぎて少しの発音のブレが致命的になるから音楽MVは漏れなく字幕付きになるけど
非常に興味深い。トニー・ラズロ氏が「日本語の『ん』は15(だっけ?)種類・発音の『ん』がある」と言ってて愕然としたがこの人も異言語話者だからこその視点。だから日本人でも日本語理解が不十分な人が多いのだよ
表意文字使ってるからな。でも中国パイセンには敵わん。表意文字と表音文字をちゃんぽんで使ってるのは中国パイセンから見たら頭おかしいと思われてるだろうか。
仏教伝来で中国語翻訳、黒船来航から英語翻訳のためにカスタマイズされてきた結果が今現在なのでこういう解釈は腑に落ちる。もし丸山圭三郎が生きてたらどんな感想になるのかなあ。
どんな言語にも文法外の文化コンテクストはあるし無意識に情報圧縮がされる。日本語はその割合が高いというのはそうなのかもしれないけど。
「単なるホニャララではなく論理的な構造体」みたいなフランス哲学構文が人を喜ばせる例。「日本語は」とつくと食いつき百倍
はいはい日本語すごい日本語すごい
多言語の文化に言及なんてまるで出来ないけど、日本語は難易度が高いのと同時にユーモアと優しさを感じる。寄り添いと改善大好きだし...ツンデレだ。第4の文字「絵文字」もすぐ作れるような柔軟な開発環境なのかな。
中国語は音だけを当てた漢字を多く含むので、漢字の意味をヒントにできない。日本語の漢字にも表音文字はあるが、 1 ページをザッと見て読まずに内容が大体分かるのはひらがなカタカナのおかげだと思う
そういうのを表す英語がニュアンスなのかな
単語間の繋がり確率を学習しただけのLLMが思考力を持つ如く文章を出力してるのだから言語が思考のプロトコルなのは間違いなさげ。ただし日本語には限定されない。主語を略すのが曖昧なら屈折語も同様だろ。英語が特殊
ナイジェリア語は文字の言語で、情報が展開されているのだろうか
サピアウォーフの仮説はほぼほぼ否定されてるが特定の構造物に対する認知プロセスの変化はあるからそれの体感だね
漢字がそういうことかな
別でブクマに上がってた森博嗣さんのエッセイでは英語の方が工学的に思考しやすいって言ってたね。日本語は情緒的すぎて設計がはっきりしないみたいな。
長文のポスト、全部AIが書いてるように見える(病)
単に表意文字と表音文字の違い。表意文字の圧縮率は高い。絵文字はもっと圧縮率は高い。
https://x.com/masayasan201911/status/2048406538835132763 まとめに入ってないけど日本よりもナイジェリアに近いアッカド文明もシュメール語の語・文字を借用してちゃんぽんで書いてたんだそうな
最終的に空気を読む・・・まで言うしなぁ。多層化されたレイヤーと感じる、というのは日本人には思いもしない視点だ
そういう意味では英語等のアルファベット言語は単なる文字の言語だよなぁとつくづく思う。でも、日本は文字を持たなかったので、模倣から始まってるんよね。全ての元祖は漢字。
ぜんぜんわからない。俺たちは雰囲気で日本語を使っている。
すべての言語がそうとしか。むしろ話者の少ない言語ほどそうじゃないかな。
だいたい藤原定家のせいですよ。
"ひらがなは音を運ぶ流れる骨格のように感じられます。 カタカナは外来要素を取り込む翻訳ツールのように機能しているように思えます。 漢字は意味を一瞬で圧縮するデータパケットのように感じられます"
トップブコメ、中国語の方が圧縮率高いのはその通りだけど、ひらがなとカタカナという表音文字を組み合わせて使ってることが、「解凍」を感じさせるのだと思うよ
【𰻞𰻞麺】ビャンビャンメンはめっちゃ圧縮してそうで何も圧縮してない
生活様式がある程度同じであるという条件も必要だったように思うんだよね。だから同じ言葉で推測されるものや価値観が近いと、より精度が高くなる。
知性の塊のような質問内容。どのような回答をするか考えるだけでも視点が上がる気がする。
まあ多系統の文字種が混在して互いに淘汰されなかったというのは珍しいのかも。個人的にはもっとアホみたいな数の文字種が作られては消えて最終的に3つだけ残った説を推したい。
視点はなかなか面白かったけど、まとめられているポストはざっとしか見てないけど、なんら面白くない。残念/展開が必要な圧縮はしてないですね。別単語にする方法が漢字変更なだけ。
多かれ少なかれどの言語も情報圧縮システムなんじゃないのん?
しゅごい…日本しゅごいぃぃ(失禁)……こうですか?わかりません!
意味が分からないなりにカタカナでそのまま流通できるのは便利
非日本語話者の同僚の文章を頻繁にみてるけど、併せて立場の違いや語彙の選択や漢字か仮名を選ぶかで相手の温度感を推し量る方法を伝えて、成程たしかに難しいなと。
日本のYouTubeサムネが「文字」だらけになるのは文字の情報密度が高いからだと思う。欧米圏はまずビジュアルで内容表現し文字で補足って感じ。日本人はビジュアルと文字の役割の違いすら意識してないよね
たぶん作者の人そこまで考えてないと思うよ
"LGTM"みたいな略語もかなり圧縮されているが、記号混ぜても高々30^nパターンしかないので衝突しそう。LGTMに関しては「いいね」のほうが
中国語系はカタカナがないから外来語ももれなく当て字なので、瞬時に判断できる利点はあるかなぁと思う。ひらがなと漢字の区別はなんでできたんですかね。ひらがなって元々漢字じゃなかったっけ?
俺は日本語しか理解できないから他言語との比較ができない。だからブコメのデモンスレイヤーもダサッとしか思わないけど、「刃」みたいな含みを「Slayer」が持ちえないとは断言できないんだよね。本当にそうなの?
元々ひらがなの流れがあって意味の強いところを漢字にしたならその通りだけど、歴史的には逆で意味の弱いところを面倒くさが効率化して変体仮名→かなとくずしていったので、圧縮はちょっと違うような
問題提起は鋭いと思うが「情報圧縮」や「多層的意味」は文字体系の話に留まらず、もっと深く日本語文化に根ざしていると思う。平安時代から、意図的な意味の圧縮は娯楽でさえあったはず(掛詞・本歌取り・見立て)
漢字(表意文字)の優位性というのは感じていたけれど、送り仮名で読みや意味の違いが判別しやすいとか、カタカナで外来語を示すとか、確かにそれだけじゃないよね。他言語を知らないので独自性の程は分からんけど。
「思考のスピード」は変わっていたと思います。漢字かな変換して、送り仮名を調整し、時に、カナにしてローマ字・英語・ドイツ語・オランダ語。フリガナつけたりして。絵文字に顔文字。全然圧縮なんかないぞ
ベトナムも韓国も漢字捨てちゃったのは勿体無いよなぁ
日本語に限らず母語話者は一つ一つの文字や単語は追わずに形を画像のように瞬時に判断していると思うが、文字種が多く漢字を含めると膨大な日本語は表現力が高く、学習者にとっては大きな壁になるんだろうな。
この考察は言語とレアリアが混ざってしまっている。まずそこを分けて考えるようにしたい。
文法法則に収まらず「文脈で判断」するケースはどの言語にもある。ヘブライ語は表記文字が基本的に子音のみで、母音は文脈で読むんだぞ。難しすぎるだろ。(聖書は誤読を防ぐために母音記号を振る)
巧妙に隠された日本スゲー。なんか読んでて恥ずかしいんだよな。
「文脈」というエンコーダー兼デコーダー
「三十一文字」なんて文化がある時点で,単位文字あたりの情報量が膨大であることは自明。
LLMよくわかってなかった頃は日本語のほうがバイトあたりの情報量が多いので、思考力が上がるのではと思ったけど、あとから英語でもトークナイズしてるから別に関係ないと知った
古来書き文字は漢字だけで表記されていたのが、ひらがなを交えるようになって文学に広がりが出た(仮名文学)みたいなのは学校で習うと思うんだけど。
日本語に主語はいらない
Xで見たときに、初見で面白い質問だなと思った。自分が使っている言語を第三者目線で考えることはまず無いからな~
フス・ロ・ダー!
とっくに言語学で分類されとろうが、圧縮は中国語のおかげで、ひらがな・カタカナ加えていいとこ取りな反面かなりの文字数を覚えないといけないわけで母語じゃないとなかなかに習得が厳しい言語な気はする。
今AIで流行りのマルチモーダルじゃん。だからまんが生成の精度もあがってきてんのかな。でも逆に高度で精密には向いていないという性質がより明らかになるような・・・
シンプルに万葉集とかの短い言葉からそこに含まれるさまざまな情景を思い浮かべる技術が古来からあったからそれが現代まで続いてるんじゃないのか?めんどくさいけど
主語を省略可能だったりいくらでも文法を破ったりしてもいいとことか空気を圧縮した言語という感じはする、整った文章は漢字だけ読めば意味理解は可能だし
この曖昧さ問題が法律文書とか設計書、仕様書には不適なのよね。文字種による圧縮と文法も省略ができる
どの言語も思考プロトコルじゃないか
メッセージ (映画)
言語の由来でどこが端折られるか変わるしなあ、雰囲気そのものの理解は自国言語以外で苦労するのは普通だろうしネイティブしかわからん
一方で南北朝鮮では漢字を捨てており、おそらく表意的効果よりも文字数節約効果の方が大きいのだろうな、と思う。『まいらせ候』みたいなもの。訓読みの勝利。カタカナ語に略語が多いのも同様の理由か。
表意文字の文化圏は圧縮してなんぼな所はあるよな。
圧縮言語といえばシャバドゥビタッチヘンシーンシャバドゥビタッチヘンシーン
中国語は漢字だけだから圧縮率は高いけどそれだけ。日本語の独自性はカタカナで外来語をそのまま取り込めることと、ひらがなによる接続で「ぱっと見」の可読性が高くて情報量が多いんだよね。頭のいいナイジェリア人
漢詩とかすごいよね圧縮 ナルトダンスの日本語訳が長くておもろい
空気ね、圧縮解凍プロトコルね
漢字で書くか、一部ひらがなにするか、全部ひらがなにするか、カタカナで書くかで込められた意味が変わるのもあるな
ワビサビを粋と感じる文化も影響してるのかな
ナイジェリアで日本語学習者と交流する日本人には思慮深い人が多いのでないか(適当)
情報理論でいうエントロピーが変化しない(と思っている)部分は省略されがちかもな。逆に省略されたということは…という思考もある。プロトコルといわれればそうかもね。
“日本語は単に「読む」ものではなく、「理解しながら展開(解凍)する」言語なのではないか、ということです。”←最終的には空気を読むに尽きる
葬送のフリーレンのタイトル回収のリュグナーの台詞を、スレイヤーとしか訳せない件をなんとなく思い出したり。英単語にもそういうダブルミーニングな単語があるのかな。
表音文字の人たちから見ると圧縮システムに見えるのはそうだろうな。140字の制限を苦にせず普及したのもその点が大きい。
すべての言葉は情報圧縮システムであり、文化的背景の違いからくる多くの含意がそれぞれの言葉にはある。読む側が文脈から解釈するのも当たりまえ。なぜ日本だけが特殊だと思いたがるのか不思議。
母語話者がそんなのわかるわけないじゃん。雰囲気でできるようになってんだから。
「ナイジェリア」って外国からの興味に過剰反応しているだけでは?どのへんが「ナイジェリアから見て」なのか分からんし特に中身があるとは思えない。返信も「日本スゴイ→俺スゴイ」勢がAI使って悦にいってるだけ
漢字みたいに意味を持つ文字と、かなカナみたいに音しか表せない文字が、緩急つけてヒラヒラしてて良いよね
表意文字と表音文字を混合して使ってるので、それぞれの良いとこ取りができてるのかな。文字の種類が多いから色んな形での言葉遊びをしやすい言語だと思う
圧縮率では中国語が圧倒的だけどな。この辺は素人の雰囲気で語るのではなくて識者の見解を聞きたいところ。
英語は静的言語であり、日本語は受け手が解釈する動的言語なんだとラリーウォールも言ってたよ インタプリタが悪いと伝わらないのも同じだね(たぶん文字数が少ない=圧縮という話ではない)
日本語は感情表現に優れていると思う。尊敬語や謙譲語、多様な三人称、語尾の使い分け等々。文章だけでその人がどういう感情を持ってるかが表現できる。英語はできないからボディランゲージで表現する
元々、奈良時代に輸入したのは中国語で、表記に必要な漢字を日本語に取り込む際に、訓読みやカナの発明で意味が詰まった漢字を展開して日本語として読むようになったからだろ。
大陸系と島国系という対比を良くするが環境による文化背景です。大陸は明確にし線引きを、島国系は曖昧にし角を立てない。プロトコルの共有による前提部の未記述な省略形の言語。だけど前提の共有が細分化してる現状
言語体系がすでにあるところに、表意文字である漢字や外来語を輸入したからだろ。民族が言語でわかれてなかったのも大きいかもな
“ひらがな・カタカナ・漢字の混在は今では、それぞれが特定の役割を持った設計構造のように見えます。日本語の文字体系は、「音 文法 意味 由来 ニュアンス」を、画面上で同時にレイヤー表示”
日本語は元々無文字言語として出発したが、後に漢字を輸入し、その意味と音の両方を利用して記述されるようになった。そのうち主に音の側面を利用したのが仮名。要するに元は全部漢字。
単に漢字の情報圧縮率が高いだけ。イーロンマスクもそんなこといってた。Xの文字数制限下なら中国語の方が情報多い(漢字ひらがなハングルはXでは2文字カウント)。適当言って日本スゲーするアカウントが恥ずかしい
中国語を勉強していて思ったけど、けっこう日本語って発音がテキトーでも通じそうなイメージある
日本には四季があるから…
AI君に漢字以外の表意文字を使う言語があるのか聞いてみたけど、現代で一定以上の規模で使われているのは漢字だけらしい。
文字のコミュニケーションや小説等において、漢字の言葉を敢えてひらがな・カタカナで書いて違いを出したり、さらにはルビで表現を多重化したり(厨二的なやつ)、単なる圧縮ではない面白さがあるね。
アメリカでは言語以外に身振り手振りや表情も使って雰囲気を伝えているが、日本は日本語だけで雰囲気を伝えられるから身振り手振りや表情などが少ないのだろうか
このナイジェリアの方の知性すごいな。
日本語は「察しろ」圧が強くてオヌヌメの言語ではない
ひらがなだけでも文章は書け、知っている漢字を加えていけば読みやすくなる。ふりがながあれば知らない漢字も読めるため、段階的に学びやすく、識字率が上がりやすい言語だと思う。
言語はすべて情報圧縮システム。そのなかで日本語が特筆すべきなのかはよくわからない。複数の文字を組み合わせて使用し、同じ単語、同じ読み方でも書き方が複数あるのは特徴的だとは思う。
日本語側から見ると、英語は音情報を圧縮している言語に思える。例:「フランス」は4音、”France”は1音。英語で書かれた歌をそのままの拍で日本語に翻訳すると間の抜けた歌になってしまう。
“ひらがなは音を運ぶ流れる骨格のように感じられます。 カタカナは外来要素を取り込む翻訳ツールのように機能しているように思えます。 漢字は意味を一瞬で圧縮するデータパケットのように感じられます。”
情報の圧縮は概ね感じのお陰だと思うが、表音文字と表意文字を都合によって使い分けられるのは便利。しかもカタカナで書くとニュアンスが変わるという便利さもある