2017/10/08 21:54:48
Haaaa_N
utf-16が拒否されるとは…
2017/10/08 22:36:27
ytooyama
不自由な言語だなあ。
2017/10/08 22:48:04
typex2
HTMLで使用できるエンコーディングはUTF-8のみとなったらしい。。(Require UTF-8 · Issue #1039 · w3c/html)
2017/10/08 22:56:51
Rockridge
「Require utf-8 when specifying character encoding by sideshowbarker · Pull Request #3091 · whatwg/htmlにより、HTMLで使用できるエンコーディングはUTF-8のみとなりました。」
2017/10/08 23:07:07
digo
まじか
2017/10/08 23:13:20
ntaoo
MSのIE,Edgeがどう対応するんだろう。今でもWinユーザーが何も考えないとCP932でソースコードを書いちゃうのでは
2017/10/09 00:16:22
sifue
そうかー。じゃあ今まで見たくcontent-typeにわざわざ書かなくて済むようにあるのかな。
2017/10/09 00:20:27
Cald
いいのでは。文字化けに悩まされるのは懲り懲り
2017/10/09 00:32:41
curaudon
さよならShift_JIS、EUC-JP。
2017/10/09 00:36:01
koyancya
せやかて工藤
2017/10/09 00:36:27
mak_in
マジか
2017/10/09 00:40:01
ptsurume
オッ!!!!
2017/10/09 00:49:13
chiba1008
ほんの10年くらい前まではShift JISがスタンダードだったのになあ
2017/10/09 01:06:20
marmot1123
古いHTML4.01のページ(SJIS)をアーカイブとして残してるのだけど、Content-typeに書いてあるのにChromeで文字化けするようになってて、修正も面倒くさいし悩んでる。ちゃんとDTD宣言書いてるんだから読んでくれよ。
2017/10/09 01:09:47
fuktommy
この辺の感覚がよくわからないのだけど、HTML4.01とかの総称としてのHTMLとは別に the HTML とでも呼ぶべき概念があるっぽい。 HTML文書は文字エンコーディングUTF-8でなければなりません - 水底の血
2017/10/09 01:18:47
Nfm4yxnW8
このへんないきもの(EUC,SJIS)は まだ日本にいるのです。たくさん。
2017/10/09 01:21:53
tick2tack
“文字エンコーディング宣言が存在するかどうかにかかわらず” まじか。ホームページ時代のサイトとかメンテされてないだろうしどうなるのかな。
2017/10/09 01:31:54
marimonbunny
まじかぁ
2017/10/09 02:01:49
norick
今はほとんどUTF-8だと思うけど、単純に現存する数で言えばShift-JISとEUC-JPの方が多いんじゃないかな。大手でも文字コードやレイアウト含めて古いコーディングスタイル残ってるし。
2017/10/09 02:07:28
rgfx
おおー
2017/10/09 02:12:58
Fushihara
ブラウザってかなり前から文字コードの直接指定するUIが消えてて、文字化けしたページに遭遇したらどうしようも無くなってるよね。前回文字化けに遭遇したの、何年前だっけ?ってレベルだけどさぁ
2017/10/09 02:17:53
barbieri
このへん独裁者が世界統一して圧制してほしい
2017/10/09 02:21:02
tsu_nyan
むしろHTML以外でも非推奨になって欲しい。いつまで文字エンコーディングで消耗してるの?
2017/10/09 02:21:41
itochan
HTMLメールにも影響するのかなあ?
2017/10/09 03:11:21
AzuLitchi
原文のパラグラフ全部ではなく最後の一文だけが引用されていますね。
2017/10/09 03:14:22
wow64
道理でchromeからエンコード設定が消えたわけだ
2017/10/09 03:39:31
kana-kana_ceo
HTML4.01が「旧マーク付け」とか「歴史的マーク付け」とか呼ばれて迫害される日も近いということですね。
2017/10/09 03:48:35
megazalrock
これはHTML Living Standard(つまりW3Cで言うところのHTML5)での話で古いSJISとかEUCのページはHTML4かせいぜいXHTMLだろうから関係はない。ただLSでは"the document must be UTF-8."だがW3Cでの勧告では”Authors should use UTF-8.” メタブに補足
2017/10/09 03:55:36
nikousatsu
ガラケーキャリアはもう少し現状に合わせて仕様をアップデートしてくれんかね。
2017/10/09 04:24:19
ryokujya
HTML.CSS.JSそろそろ次の話は出てこないものなの?
2017/10/09 04:24:26
kkobayashi
今後はまぁそれで良いとして過去の仕様も残しておいて欲しいのだが。昔のホームページなんてほとんどシフトジスやろ
2017/10/09 05:01:12
uehaj
HTMLで使用できるエンコーディングはUTF-8のみとなりました
2017/10/09 05:23:45
UDONCHAN
そうだね
2017/10/09 05:58:50
sachikolondon
基本、UTF-8だから問題なし。
2017/10/09 06:12:57
tanakh
新しいのは良いけど、過去のドキュメントはちゃんと解釈して欲しいが…。てかHTMLはバージョン分けしてるのではないのか。
2017/10/09 06:13:51
srgy
Set Character Encoding - Chrome Web Store chrome.google.com
2017/10/09 06:19:42
sirocco
昔作ったEUC-JPのデータベースをなんとかしなくてはと思いつつもそのまま。
2017/10/09 06:25:26
naosim
っしゃ!
2017/10/09 06:47:13
kibitaki
こういう煽りがWeb上に残ると実装でアジャストしろよとか内部エンコーディングは別とかwhatwgじゃねーかとか勧告とはって話になると全部イヤイヤ期に退行する子の温床になるので困る。
2017/10/09 06:53:05
t-sat
何かよく分からんな。もしこの解釈が正しいなら、そもそもなんで「文字エンコーディング宣言」が存在するの?
2017/10/09 07:13:28
m4fg
BOM「呼んだ?」
2017/10/09 07:13:56
nozipperar
SJISとEUCは本当に消えて欲しい 邪魔
2017/10/09 07:15:37
mohno
「HTMLで使用できるエンコーディングはUTF-8のみ」←“新しいHTML規格で”ということだよね?
2017/10/09 07:19:14
zettaimuri
もうだいぶ前からUTF-8しか使ってない
2017/10/09 08:11:01
michinao
はてなダイアリーどうする?
2017/10/09 08:15:29
abababababababa
とうとう…。しかしChromeのUIからエンコード設定項目消えて「文字化けとは?」を目で見せるのが面倒くなった。拡張あるが。近々「え?文字コードって何それ?w」と言われそう。トイレの流すボタン知らない子みたいに。
2017/10/09 08:37:24
plutan
やっとかよ、という感想
2017/10/09 08:48:26
Hiz22J
未だWindowsのシステムロケールをUTF-8に設定することすら出来ない以上、SJIS文書はこれからも生産され続けるわけだが…。
2017/10/09 09:00:48
Nyoho
NEXTSTEPでUNIX系に入ったからEUCで育った。20年経てば随分状況が変わるね。
2017/10/09 09:17:16
valinst
全人類ASCII文字しか使わなければ色々スマートになるのに
2017/10/09 09:28:54
uturi
行政サイトが結構大変そう……と思ったが、その辺はもうUTF-8化されてるかな。古いwebサイトがgoogle八分にされる日も近そう。
2017/10/09 09:30:43
KoshianX
え、選択肢がなくなるのは困るなあ……。過去の資産もあるしそれに引きずられたシステムもあろうに。いや新規のものは UTF-8 に統一しろというのはわからんでもないが。
2017/10/09 09:40:33
kz78
電子的なコンテンツは最新の規格に適合するように管理し続けないとすぐ死ぬんだなぁ、と。
2017/10/09 09:45:10
miz999
知る限りでは、いまだにshift-jisの大手サイトは2ch(5ch)と価格コムだな。あとDMMの一部がEUC-JP
2017/10/09 09:59:10
yorkfield
新しく作るHTML文書をUTF-8にするのは当然だな。
2017/10/09 10:07:26
at_yasu
警告レベルにしてくれりゃいいのに。。。
2017/10/09 10:07:50
sazae657
UTF-8面倒くせえからアメリカ人抜きでUTF-64辺りを策定して完全に固定長にしてどうぞ
2017/10/09 10:08:53
poka_poka
日本のamazonもshift-jisなんで、なかなか統一されるのには時間かかるんじゃないかな…
2017/10/09 10:10:35
itouhiro
GoogleChrome61では「エンコード」がメニューからなくなってるな。以前のGoogleChromeにはあったのだが。Firefoxはいまでも「Alt - 表示 - テキストエンコーディング」がある。はてなダイアリーは今でもEUC-JPだよね。
2017/10/09 10:14:30
aokirozin
やっと
2017/10/09 10:51:37
mtane0412
Web遺産が古文書になってきた
2017/10/09 11:03:30
rti7743
古いサイトはSJIS結構ある。chromeからエンコードメニューが消えて困っているんだよなあ。 新しいのはUTF-8で統一でいいと思うけど。
2017/10/09 11:16:30
numpad0
日本語のエンコーディング多様性とか絵文字とか、アメリカのヤードポンド法とちょっと似ている面ないとはいえない
2017/10/09 11:19:30
timetrain
HTML3時代に作ったSorry!Japanese Only!なサイトがまだ消えずに残ってるけどさすがに修正する気にならん
2017/10/09 11:24:20
yug1224
汚物は消毒だー!!
2017/10/09 11:27:04
peppers_white
自動エンコード機能のないブラウザばかりになってるからutf8で書かないとダメという、見る側が介護されるものばかり
2017/10/09 11:31:19
odap
今でもHTML手書きでコツコツと作ってる現場はどうするのがいいのだろう?UTF-8が使えるエディターを見つけるところから始めないとなぁ。
2017/10/09 11:33:23
shields-pikes
あと、Excelが吐き出したり読み込むCSVやTSVもUTF-8をデフォルトにしてくれれば、「文字化けしてて読めません」問題がかなり減る。
2017/10/09 11:36:32
okachan_man
ExcelもUTF-8に対応してくれないかな。。
2017/10/09 11:38:10
ktra
最近のエディタもutf8以外考えなくなってきてるよね。指定しないと他のエンコードでは読みもしなかったり
2017/10/09 11:50:17
suquiya0
おお…。こういうことになったのか…?
2017/10/09 12:03:22
wnoguchi0727
統一世界の話
2017/10/09 12:11:17
side_tana
はい
2017/10/09 12:24:04
goodstoriez
“これにより、古いHTMLでは許容されていた、Shift_JIS、ISO-2022-JP、EUC-JP、UTF16LEといった文字エンコーディングは適合するHTMLではなくなりました”
2017/10/09 12:32:15
dacksf25
もっと早めに宣言してくれたほうが逆によかった。早くShiftとEUCは死んでほしい。
2017/10/09 12:34:23
enemyoffreedom
古いサービスはけっこうEUCやSJISも残ってるわね
2017/10/09 13:00:02
manFromTomorrow
でもこれWHATWGでの話
2017/10/09 13:19:33
mangakoji
やめてぇ!wzがutf8に対応してくれないの!
2017/10/09 13:24:34
cats_nukui
さようなら。
2017/10/09 13:27:21
m_m3zono
(ブコメで)言われてみれば文字化け→手動で文字コード変更することも、いつの間にか無くなったな。
2017/10/09 13:33:14
b4takashi
Shift_JISとかEUC-JPとかちゃんと名乗っているなら許容してくれないのかな…
2017/10/09 14:06:47
hatsu_mi
ガラケーサイトどうすんだろ
2017/10/09 14:11:37
wwolf
はい
2017/10/09 14:35:59
cwmoz22
やっとって感じする
2017/10/09 14:39:57
keshitai
ニフティの@ホームページで作ったシフトJISのサイトを引っ越したけど、iPhoneで問題なく表示されているうちはそのまま放置だな。
2017/10/09 15:08:16
nilab
「古いHTMLでは許容されていた、Shift_JIS、ISO-2022-JP、EUC-JP、UTF16LEといった文字エンコーディングは適合するHTMLではなくなりました」
2017/10/09 15:31:23
y2_naranja
OSC北海道のあのEUC-JPだけでも何とかしてほしい。技術系サイトなのに、それだけで行く気なくす。
2017/10/09 15:45:51
AmaiSaeta
「最新版のHTML規格」の話だよね。以前に書かれたHTML4以前の文書が不正になる訳じゃない。今在るHTML5(と判別される)文書はどういう扱いになるんだろう? | id:s-tomo 規格上の話。今正常な文書が不正扱いされてしまうのか?
2017/10/09 15:47:47
rryu
HTML5にしたいというだけでDOCTYPEだけ変えた系のサイトが爆死しそう。
2017/10/09 15:57:52
wushi
なりましたと書いてあるのにRFCへのリンクがないと思ったら、別団体というか別規格の話なのか。HTML Living Standardって初めて聞いた…最近の流れを追ってみないとまずそう
2017/10/09 16:37:50
luccafort
utf8に統一はいいしもっと早く決断しても良かった気はするがutf16LEが駄目ってのはちょっと意外感ある。使うことないって言えばないけどね。
2017/10/09 16:54:11
lets_skeptic
HTMLはいいんだけど、未だに半角カナだから文字幅半分で1バイト文化が普通にある。特に帳票周り。文字エンコーディングなんかろくに理解できない層だからSJISは次の時代まで現役。
2017/10/09 16:57:46
ikaro1192
よい話
2017/10/09 17:03:08
takatomo-h
むしろUTF-8以外の文字列は死滅してくれ
2017/10/09 17:11:43
regularexception
HTMLはいいけどメールがなぁ
2017/10/09 17:38:09
nishik-t
WindowsもUTF-8にしてくれないか
2017/10/09 17:45:10
iku-sawa11
ふむ
2017/10/09 17:52:26
nozomu365
グッバイ文字化け
2017/10/09 18:08:51
gabill
HTML5でDOCTYPEからバージョン番号を廃止したんだから、責任持って未来永劫、後方互換性を維持してほしい。それが出来ないんならバージョン番号付けてほしい。これじゃ安心して未来人にポエムを残せない。
2017/10/09 18:34:43
tincast
/(^o^)\なんてこったい! と思ったらHTML5の話か… まぁ、それでも困る人は多いんだろうなー。
2017/10/09 18:59:38
Akkiesoft
<meta charset="utf-8">書かなくても良くなるん?
2017/10/09 19:22:58
ks1234_1234
えー いまさらめんどい 自分ようしらんのだけど,Linuxではいま日本語文書コードはEUCなのUTF-8なの?
2017/10/09 19:36:45
hiddy216
うーん、作る側の効率だけが優先されるのはどうかと思うけどな。わたくしも作る側だけれど。。
2017/10/09 19:58:39
aoiyotsuba
今更書き直す古いサイトもないだろう
2017/10/09 20:09:40
yuzu441
いつまでこいつらはSJIS文書投げてくるんだと思いながら仕事してる
2017/10/09 20:10:16
qt_fb
Chromeから文字コード選択が消えて、ジオシティーズのサイト発掘する時に困ることがしばしばあるんだよなー
2017/10/09 20:34:42
kitaindia00
mixiはEUC-JPだ
2017/10/09 21:26:30
june29
実際問題、スマートフォンのブラウザで UTF-8 じゃないウェブページを開いたとき、文字化けしてどうしようもないしね…。
2017/10/09 21:37:52
blackshadow
WindowsもUTF8が標準にならないかな。
2017/10/09 21:39:59
gyu-tang
まじか!これ影響大きいのでは?
2017/10/09 21:53:23
akulog
正直「やっとか」と言うところ
2017/10/09 21:55:30
garage-kid
527
2017/10/09 22:06:17
guldeen
シフトJISもEUC-JPも、とうとう『歴史の彼方』の存在か…。古いPCの中のHDDの中身のサルベージが(ソフト的に)できなくなる日も、遠くなさそう。
2017/10/09 22:11:34
yuyarin
嬉しい気持ちは分かるけど、文化破壊的な側面もあるんだよなぁ…
2017/10/09 22:45:57
stealthinu
こういう方向にすべきとは思ってるんだけど、なんか退化していってる気がしてならない…
2017/10/09 22:47:43
s-tomo
id:AmaiSaeta どうって、これを受けてUTF-8以外の対応を外しでもしたらシェア下がるだけだから実装の方は今まで通りでしょう。
2017/10/10 01:44:36
kamezo
う。放置したままの古いwebページがたくさんあるような(汗
2017/10/10 01:52:51
a2c-ceres
DOCTYPEにバージョン番号書いててもダメなの?HTML書式はUTF-8一般化以前からあるのに影響大きすぎないか?
2017/10/10 02:05:59
nakakzs
すでにiPhoneの主要ブラウザじゃ、昔ながらのS-JISサイトとか文字化けして見られないしなあ(自動エンコードがどうやらアプリ規約でダメらしい)。
2017/10/10 07:04:47
teramako
living standardとしてバージョンを持たない進化が後方互換性を持たないのは禍根を残しそう…。
2017/10/10 08:39:42
houyhnhm
UTF8は、BOMがー。
2017/10/10 09:22:40
inazuma2073
ここ数年EUCで書かれたサイトのメンテばっかりしててほんと滅びろって思い始めてる。
2017/10/10 09:50:26
frontline
Chromeから文字コード選択の機能が消えているのに気付いたのが最近のこと……「あれ?あれ?」ってずっと探してたww。もう今の若い人に「EUC」って言っても通じない。
2017/10/10 10:04:15
treeapps
まじかよ楽天市場解約してくる
2017/10/10 10:13:50
inouetakuya
みんな、がんばろうな!
2017/10/10 10:38:03
vvakame
いい話
2017/10/10 10:40:13
masaru_b_cl
これは説得材料の一つになる
2017/10/10 11:33:13
lequinharay
分かるけど絶対に更新されないレガシードキュメント達がこれに対応はしてくれないわけで……なんか拡張を入れるしか無いのかね
2017/10/10 12:26:48
nezuku
今後のサイトはともかく、これまでのウェブサイトを閲覧するにあたって困るのだけれども… すでにブクマ※にあるように、Chromeの文字エンコーディング変更メニューが消えたの困った。
2017/10/10 12:34:27
lyiase
HTML LSによるとMUSTらしいので必須か。HTML4とかXHTML1.xは古いHTMLには適用されないだろうね。あとこれはつまり「<meta charset="">」がUTF-8以外は禁止になるってことかな。
2017/10/10 13:05:14
nf_ban
あぁ、これは古いコンテンツ持ってる人ほど大変で報われないパターンだ…
2017/10/10 13:29:14
khtokage
WindowsのCP932がなくなれば手元は全てUTF-8環境に出来るんだけどなぁ…… Windows・UN*X共用のライブラリ書いてるとたまに嵌まってすげー面倒臭い。
2017/10/10 13:59:18
masakih
「Unicode系であれば 冒頭に<!DOCTYPE があればエンコードが分かります(キリッ」 はどうなったの?
2017/10/10 14:20:40
jeffreyfrancesco
これは単に「今後はこうしましょう」ってだけの話で、ブラウザが実装(後方互換性の確保)をどうすべきかってのはまた別の話
2017/10/10 15:23:47
primedesignworks
せめて 10 年前に言ってほしかった。
2017/10/10 16:39:05
zu2
“さよならレガシーエンコーディング”
2017/10/10 16:52:42
hi_kmd
後方互換性を言い訳にしてUS-ASCIIだけを優遇したUTF-8を、全HTML文書で強要して他言語の後方互換性を毀損するの、不愉快。自由なエンコーディング選択を我々から奪うな。(感情論)
2017/10/10 18:15:03
dwarfjay
日本語Windowsな人達は大変ですねぇ
2017/10/10 18:45:22
kazatsuyu
Chromeで文字化けする、というブコメがあるが、meta要素を正しく設定したところ特に問題はなかった。規格を見る限りでは、URLのエンコーディング等に利用されるdocument associated encodingがUTF-8でなければならないだけ
2017/10/10 19:53:52
hevohevo
うはー。時代ですねぇ。色々と問題はあるかもしれないけれど、現実的な解としては妥当かなと。
2017/10/10 19:59:58
kasei_san
“HTMLで使用できるエンコーディングはUTF-8のみとなりました。これにより、古いHTMLでは許容されていた、Shift_JIS、ISO-2022-JP、EUC-JP、UTF16LEといった文字エンコーディングは適合するHTMLではなくなりました。”
2017/10/11 00:25:52
kumamotone
つい最近10年くらい前に作ったページ見たら文字化けしてて、Chrome標準の機能に文字化け直すもの見当たらなかったのでわざわざextension入れた
2017/10/11 02:05:23
PowerEdge
ガラケーに配慮して出力だけCP932使ってるレガシなcHTMLサイトがあるが、今年中にUTF-8に変えることにしている。Eメールは相変わらずISO-2022-JPで送受信する人多すぎ問題があるが解決しそうにない。
2017/10/11 11:19:50
y-Aki
今時はレガシーエンコーディングな場合ヘッダーのContent-Typeで指定すべきだからなー(head内meta http-eqivだけではNG
2017/10/11 14:54:38
shinagaki
BOM付きUTF-8 滅びろ