- -pv
スレッドの閲覧状況:
現在、- がスレを見ています。
これまでに合計 - 表示されました。
※PC・スマホの表示回数をカウントしてます。
※24時間表示がないスレのPVはリセットされます。

文字コード

1名無しさん@おーぷん:2014/10/14(火)23:41:15 ID:8rLPCrvyK()
奥の深い、迷い込んだら二度と出られない文字コードの世界へようこそ。

シフトJIS、ISO/IEC 2022、EUC、Unicode、UTF-8、UTF-16、サロゲートペア、VS、IVS、
合成文字、ソート、外字、CCS、CEF、CES、TRONコード、その他について語り合いましょう。
質問や、プログラミング言語での文字列の処理方法などもどうぞ。
40名無しさん@おーぷん :2018/01/24(水)06:37:56 ID:vrK
何を求めてるのか知らんがこういうのか
https://tools.ietf.org/html/rfc5137
41名無しさん@おーぷん :2018/01/25(木)09:04:06 ID:bva
>>40
あー実体参照ってW3CじゃなくてRFCになってたのか、なにげに10進使うなと言ってるのが面白いな
でもこれユニコード本体のエンコードかなんかに追加してくれないと従来処理との切り替えができないから結局使えなくない?
42名無しさん@おーぷん :2018/01/25(木)20:25:12 ID:ukb
そもそもエスケープって文字列リテラルの機能だから、文字コードの仕様に入れるのは変
取り入れたい言語が取り入れればいい
43名無しさん@おーぷん :2018/01/25(木)23:13:20 ID:bva
文字を文字列で表現する機能ではなくて、代替文字表現じゃないかな?
機能コードを前置するから文字列に見えるけどあくまで一つのシーケンスコードが文字化けしてるだけみたいな
44名無しさん@おーぷん :2018/01/27(土)00:47:20 ID:IVV
お前は何を求めてるんだ?
全てのプログラミング言語で同じエスケープ文字の構文を使えるようにしてほしいのか?
現時点だって\nとかはほとんどの言語で使えるし、そこまで求める意味がわからん
45名無しさん@おーぷん :2018/01/27(土)08:48:31 ID:JKg
使えない奴は使えない奴でいいから、使える環境と区別可能にしてほしいな
エスケープシーケンスなんかは端末の種類を指定するものがあるけれども、
C1集合の代替とかはできてもC0つまりエスケープ自身のエスケープが問題だな
46名無しさん@おーぷん :2018/02/17(土)14:25:55 ID:Wct
ファイルはUTF8
内部でUTF16
に統一してたら楽だったのでは?
47名無しさん@おーぷん :2018/02/18(日)07:18:07 ID:lS8
UTF16だとサロゲートペアの問題があるから全部UTF8の方がいい
48名無しさん@おーぷん :2018/04/08(日)22:13:43 ID:2Yt
普通に32bit固定長のコードとそのサブセットエンコードがあれば、アホらしい変換テーブルなんて必要なかった
49名無しさん@おーぷん :2018/06/10(日)08:06:13 ID:hQ8
サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
http://news.livedoor.com/article/detail/14840390/

新着レスの表示 | ここまで読んだ

名前: mail:





文字コード
CRITEO