gitで日本語ファイル名を保存してると、Macで保存したファイルがWindowsやLinuxで取り出したとき、おかしい表示になる。
http://www.bekkoame.ne.jp/~iimori/sw/UnicodeUtilsOSAX.html https://tama-san.com/hfsplus/ NFDもApple独自のルール
詳しい人の解説は読んでて楽しい。Unicodeは日本語の文化的な事情が軽視されがちなので、日本語ネイティブ的に違和感のある仕様が多い。
[nfd[nfc]
日本語圏だと余計なことをして、むやみに複雑にしていると感じるけど、他の言語圏ではどうだろう
“現状で対応するのであれば、事前にファイル名を UTF-8-MAC の逆変換に正規化するのが一番シンプル”
そういや、うちはハードディスク含めてAPFSで初期化してるな。Big Sur以前の昔はTime MachineがHFS+専用で統一できなかった
HFS+にてUTF-8−MACを実装したのがかなり引きずっているんだなぁ感 / 一昔前のiOSの更新でAPFSに移行したときファイル名そのままファイルシステムに保管していたPDFビューアの類で濁点付いたファイル開けないの思い出した
i'm
これだけ丁寧に説明されてもややこしくて、1年後に正しい認識を持ててる自信がない。NFD正規化はまだわかるけど、UTF-8−MACみたいな環境中立なはずのUnicode規格に環境依存を持ち込んだのが悪手だったのでは。
今考えれば「何でファイルシステム上のファイル名を正規化した?」だけど、そのタイミングではこうした方が並び順がきれいとか、これがいいと思わせるものがあったんだろうなぁ。技術負債を取り除くのは難しい。
検索性/互換性以外の理由で正規化する設計意図がよく分からない
後でちゃんと読むけどなんでそんなことしたん。Finderとかいうクソのため?
おま国扱いが戻ってきててまた顕在化してんよなあ。禄に発表もせんと勝手に大幅に仕様変えるくせに、この辺は全く直す(合わせる)気無いんやからまあしゃーない。「そう、Appleならね(m9(^Д^)プギャーw)」
APFSに移行するときにFinderも正規化しないようにしてくれればよかったのに…過去の互換性とかの問題なんだろうけど
macでdockerがクソな理由の一つ。hostのディスクマウントして日本語ファイル扱うと地獄と化す
“Apple”
ぼんやりとしか理解してなかったけど非常に分かりやすいまとめだった。
MS932問題を思い出す。既存の文字コードをOSで扱うときに発生する問題を吸収するために少し違う独自規格を作るのだろうが、一旦独自規格を作ってしまうとそこに縛られるため時間経過で問題が噴出する。
クラウドストレージによっては、同名?なんやこれ→あー〇〇さんがMacでいじったんだ!統合したいけどどっちが最新なのか区別つかんのが百件以上ある😇なトラブルまれによくあった
“個人的には、これらの正規化は文字列を検索する時に互換性がある文字にマッチしやすくするために使うべきと考えています” 同意すぎる
要約がそもそも複雑で理解できん。てか、そもそも正規化ってなんや?
“うか。しかしそれを行うためには、先に Unix の世界に照合順序を導入しなければならないはずです。macOS 15.4 でそれが実現されたので、将来の macOS では NFD 正規化や UTF-8-MAC 正規化が廃止されるかもしれません。それが実
最近の状況知らなかったので興味深い。濁点とかより、波ダッシュと全角チルダとか、住所表記で入れさせられる全角ハイフンとかの方が本当は正規化が必要とされてると思う
macOSデバイスと、Windowsデバイスを混ぜてビジネス環境で使わないで欲しいわ。ファイル名トラブルおきるから🥺
Apple Modified NFD などとも呼ばれることがあるやつ。
誤解の多い「NFD問題とUTF-8-MAC問題」を解説する - macOSの濁点を含むファイル名の扱い - Qiita
gitで日本語ファイル名を保存してると、Macで保存したファイルがWindowsやLinuxで取り出したとき、おかしい表示になる。
http://www.bekkoame.ne.jp/~iimori/sw/UnicodeUtilsOSAX.html https://tama-san.com/hfsplus/ NFDもApple独自のルール
詳しい人の解説は読んでて楽しい。Unicodeは日本語の文化的な事情が軽視されがちなので、日本語ネイティブ的に違和感のある仕様が多い。
[nfd[nfc]
日本語圏だと余計なことをして、むやみに複雑にしていると感じるけど、他の言語圏ではどうだろう
“現状で対応するのであれば、事前にファイル名を UTF-8-MAC の逆変換に正規化するのが一番シンプル”
そういや、うちはハードディスク含めてAPFSで初期化してるな。Big Sur以前の昔はTime MachineがHFS+専用で統一できなかった
HFS+にてUTF-8−MACを実装したのがかなり引きずっているんだなぁ感 / 一昔前のiOSの更新でAPFSに移行したときファイル名そのままファイルシステムに保管していたPDFビューアの類で濁点付いたファイル開けないの思い出した
i'm
これだけ丁寧に説明されてもややこしくて、1年後に正しい認識を持ててる自信がない。NFD正規化はまだわかるけど、UTF-8−MACみたいな環境中立なはずのUnicode規格に環境依存を持ち込んだのが悪手だったのでは。
今考えれば「何でファイルシステム上のファイル名を正規化した?」だけど、そのタイミングではこうした方が並び順がきれいとか、これがいいと思わせるものがあったんだろうなぁ。技術負債を取り除くのは難しい。
検索性/互換性以外の理由で正規化する設計意図がよく分からない
後でちゃんと読むけどなんでそんなことしたん。Finderとかいうクソのため?
おま国扱いが戻ってきててまた顕在化してんよなあ。禄に発表もせんと勝手に大幅に仕様変えるくせに、この辺は全く直す(合わせる)気無いんやからまあしゃーない。「そう、Appleならね(m9(^Д^)プギャーw)」
APFSに移行するときにFinderも正規化しないようにしてくれればよかったのに…過去の互換性とかの問題なんだろうけど
macでdockerがクソな理由の一つ。hostのディスクマウントして日本語ファイル扱うと地獄と化す
“Apple”
ぼんやりとしか理解してなかったけど非常に分かりやすいまとめだった。
MS932問題を思い出す。既存の文字コードをOSで扱うときに発生する問題を吸収するために少し違う独自規格を作るのだろうが、一旦独自規格を作ってしまうとそこに縛られるため時間経過で問題が噴出する。
クラウドストレージによっては、同名?なんやこれ→あー〇〇さんがMacでいじったんだ!統合したいけどどっちが最新なのか区別つかんのが百件以上ある😇なトラブルまれによくあった
“個人的には、これらの正規化は文字列を検索する時に互換性がある文字にマッチしやすくするために使うべきと考えています” 同意すぎる
要約がそもそも複雑で理解できん。てか、そもそも正規化ってなんや?
“うか。しかしそれを行うためには、先に Unix の世界に照合順序を導入しなければならないはずです。macOS 15.4 でそれが実現されたので、将来の macOS では NFD 正規化や UTF-8-MAC 正規化が廃止されるかもしれません。それが実
最近の状況知らなかったので興味深い。濁点とかより、波ダッシュと全角チルダとか、住所表記で入れさせられる全角ハイフンとかの方が本当は正規化が必要とされてると思う
macOSデバイスと、Windowsデバイスを混ぜてビジネス環境で使わないで欲しいわ。ファイル名トラブルおきるから🥺
Apple Modified NFD などとも呼ばれることがあるやつ。