- -pv
スレッドの閲覧状況:
現在、- がスレを見ています。
これまでに合計 - 表示されました。
※PC・スマホの表示回数をカウントしてます。
※24時間表示がないスレのPVはリセットされます。

文字コード

1名無しさん@おーぷん:2014/10/14(火)23:41:15 ID:8rLPCrvyK()
奥の深い、迷い込んだら二度と出られない文字コードの世界へようこそ。

シフトJIS、ISO/IEC 2022、EUC、Unicode、UTF-8、UTF-16、サロゲートペア、VS、IVS、
合成文字、ソート、外字、CCS、CEF、CES、TRONコード、その他について語り合いましょう。
質問や、プログラミング言語での文字列の処理方法などもどうぞ。
2名無しさん@おーぷん :2014/10/14(火)23:46:19 ID:8rLPCrvyK()
おーぷん2ちゃんねるはUTF-8で、シフトJISではないのが特徴的であり、強みかと思われます。
日本語以外の文字も色々と書き込みが可能なので、幅広く文字について語れるものと
期待をしております。のんびりまったりとどうぞ。
3名無しさん@おーぷん :2014/10/14(火)23:49:51 ID:8rLPCrvyK()
最近気になった話題はこれ

「絵文字に平等をサポートしてください」人種差別の指摘にゆれるUnicode
http://internet.watch.impress.co.jp/docs/special/20141007_670150.html
4名無しさん@おーぷん :2014/10/15(水)15:56:33 ID:B3MuP9744
JavaScriptはES6で正規化とサロゲートペアの扱いが良くなった
5名無しさん@おーぷん :2014/10/16(木)00:13:14 ID:CCHQL4M3A
Windowsで、OSとしてIVSに対応開始したのはWindows 7から

モバイルだと、Androidは未だに対応していない。
iOSは使っててもよく分からないけど、対応してるんだろうか?絵文字
についてはiOS 5か6頃に対応開始をしたと思う。
6名無しさん@おーぷん :2014/10/16(木)04:22:17 ID:glaDOz8Pe
漢字を減らすべきだと思うね
7名無しさん@おーぷん :2014/10/16(木)19:17:29 ID:CCHQL4M3A
既に手遅れだけど、漢字は異体字番号をつけて区別する方が
良いような気がする。
8名無しさん@おーぷん :2014/10/16(木)19:42:47 ID:ZF3KdRASn
色付き絵文字の問題はどうするのがいいんだろう
9名無しさん@おーぷん :2014/10/16(木)20:35:32 ID:glaDOz8Pe
肌色は緑にする
10名無しさん@おーぷん :2014/10/16(木)20:41:36 ID:zz4GgyTxp
肌色が緑とか、ナメック星人ですか
11名無しさん@おーぷん :2014/10/16(木)21:12:40 ID:glaDOz8Pe
じゃ青に
12名無しさん@おーぷん :2014/10/16(木)21:18:56 ID:GOAgSoFrc
ガミラス人か…w
13名無しさん@おーぷん :2014/10/16(木)21:34:45 ID:CCHQL4M3A
肌の色が全く違う宇宙人に対しても平等を期するためには、
R・G・Bを表わす文字が必要になりそうだな

(顔) U+rrrrr U+ggggg U+bbbbb みたいに4つ並べて表現する。

無茶だ
14名無しさん@おーぷん :2014/10/16(木)22:07:44 ID:GOAgSoFrc
これは、まず良い結果にはならない問題だよなあ…
15名無しさん@おーぷん :2014/10/16(木)22:19:54 ID:GBKndfmfY
例えばリンゴの色を変えたい場合、
赤いリンゴでも青いリンゴでも、葉っぱの色は緑のままのはずだし、
結局は何パターンか別の絵文字として定義するってのもありだと思う。
もしくは今も一部の絵文字がやってるように合字を使って、
『特殊記号+葉っぱ合字+緑合字+リンゴ核合字+赤合字』とするとか。
16名無しさん@おーぷん :2014/10/17(金)12:44:56 ID:7LUbXBXJW
日本人的にはたかが絵文字なのにな。
色を場所ごとに変えるとかなると、全部分解して組み合わせるしかないけど…誰が実装すんの。面倒くさい

元々はキャリア間での変換の利便性のためにGoogleが入れたんだよな。
17名無しさん@おーぷん :2014/10/17(金)22:47:31 ID:e0SYCAo1n
一応既存の技術で結合先に合わせて形を変える事もできるから
一ツ葉、双葉とだけ定義してそれをリンゴやブドウに組み合わせるとかもできなくはなさそう。
まあそこまではいかなくても部分的な色を変えるだけなら可能だろう。
こういう時に属性を気軽に増やせるSVGフォントは優位だな。
18名無しさん@おーぷん :2014/10/22(水)05:02:29 ID:9slPtU718
青い肌はダメだったわ

ファゲイト一族 - Google 検索
https://www.google.co.jp/search?q=%E3%83%95%E3%82%A1%E3%82%B2%E3%82%A4%E3%83%88%E4%B8%80%E6%97%8F
19名無しさん@おーぷん :2014/10/27(月)19:26:22 ID:8FgdtNV5q
AppleScript - Swiftでの文字列比較におけるUnicode正規化を巡る注意点
http://qiita.com/doraTeX/items/4feea8d9221419b19954

結果が予想できない実装とかアレだなとか思って読んでいたら、
最後、AppleScriptはもっとヤバかったというオチがあった。

"㍑" と "りっとる" が一致するとか、プログラマーの誰が求めているというのか…
プログラミング言語の実装としてここまでやる必要があったのかどうか謎
20名無しさん@おーぷん :2014/10/27(月)20:21:54 ID:mECBfx9bN
今の実質のAppleScriptはJavaScriptだから問題ない。
SwiftもJSの成り損ないだし
21名無しさん@おーぷん :2015/03/01(日)23:11:39 ID:iIy
【IT】「黄色いアジア人」のアップル絵文字、中国で「黄色すぎる。人種差別だ」「アジア人への偏見の表れだ」と批判殺到[2015/02/26]
http://uni.open2ch.net/test/read.cgi/newsplus/1424926823/

早速余計なトラブルを引き起こしているようですね。


この黄色は色を指定しなかった時のデフォルトなんだけど、
なんで黄色なんかにしたのかよく分からないんですよねぇ。
http://www.unicode.org/reports/tr51/tr51-2.html
もうちょっと人間離れした色にしたらよかったのに。
22名無しさん@おーぷん :2015/03/04(水)23:38:46 ID:ApP
なんかの企画で標準が黄色だったはず
23名無しさん@おーぷん :2015/03/07(土)23:51:01 ID:8L3
UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由
http://internet.watch.impress.co.jp/docs/special/20150307_691658.html

Unicodeの~の字形がついに修正されるらしい。
修正はUnicode 8.0からとのこと。
24名無しさん@おーぷん :2015/03/20(金)01:42:02 ID:kzu

25名無しさん@おーぷん :2015/04/11(土)23:13:51 ID:XjP
iOS 8.3で、遂に絵文字の色変更に対応したようですね。

OS更新するかどうか迷うところ
26名無しさん@おーぷん :2015/11/10(火)18:56:40 ID:fVa
Macの濁点が結合文字で嵌まったわ
同じ文字で二種類の表現があるとか勘弁してほしい
27名無しさん@おーぷん :2016/04/30(土)18:41:28 ID:YTN
波ダッシュと全角チルダではまったわ
〜~
どっちがどっちでしょう
28名無しさん@おーぷん :2016/06/04(土)03:05:17 ID:cwU
>>27
ブラウザでは最初が全幅チルダなんだな
datを読むと両方波ダッシュにされてしまうということはオープンのdatは生データじゃないのか?
それともオープン対応専ブラでは問題無し?
日本語以外の文字(絵文字とか)も普通に使えたりするの?
29名無しさん@おーぷん :2016/06/04(土)11:41:12 ID:Nbz
HTMLはUnicode、datはShift_JISだから、文字コード変換の時に一部の文字が変わる
専ブラだと普通はdatを読むから、影響を受けるだろうな
おーぷんだと絵文字は投稿の段階で弾くけど、Unicode固有で弾かれなかったものは、datだと?に変換される
30名無しさん@おーぷん :2016/07/06(水)12:23:53 ID:R9e
cp437
31忍法帖【Lv=3,じごくのよろい,nQl】 :2017/10/06(金)02:11:22 ID:n2D
上がるかな
32名無しさん@おーぷん :2017/11/10(金)02:44:59 ID:Sa3
U+20E2を使うと、熱盛を文字だけで実現できる。
Androidでは見られるけど、Windows 7ではダメだな

熱⃢盛
33名無しさん@おーぷん :2017/11/17(金)03:45:38 ID:lgW
UTF8の2バイト文字

UTF8 2byte
http://orange-factory.com/sample/utf8/code2.html
34名無しさん@おーぷん :2017/11/17(金)04:08:19 ID:lgW
Unifontの全文字ってのがあったぞ

unifont-10.0.06.bmp (BMP Image, 4128 × 4160 pixels) - Scaled (15%)
http://unifoundry.com/pub/unifont-10.0.06/unifont-10.0.06.bmp
35名無しさん@おーぷん :2017/12/24(日)21:56:33 ID:xzO
人名漢字の全てがUnicodeに登録されたらしい

コンピューターで全漢字使用可に 6万字コード化
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
36名無しさん@おーぷん :2018/01/05(金)10:00:11 ID:CbX
欧米では全角文字ってあまり使われないのかな?
入力方法が一般的でなのかな
37名無しさん@おーぷん :2018/01/05(金)11:20:18 ID:eY9
最近は海外でも絵文字が使われてるのを結構見るな
その影響でソフトのUnicode対応が進んでいるとか
38片山博文MZ◆T6xkBnTXz7B0 :2018/01/10(水)22:13:14 ID:aje
>>34
凄い
39名無しさん@おーぷん :2018/01/24(水)02:08:57 ID:VrC
エスケープ文字の言語に依存しない国際規格って無いのだろうか?
40名無しさん@おーぷん :2018/01/24(水)06:37:56 ID:vrK
何を求めてるのか知らんがこういうのか
https://tools.ietf.org/html/rfc5137
41名無しさん@おーぷん :2018/01/25(木)09:04:06 ID:bva
>>40
あー実体参照ってW3CじゃなくてRFCになってたのか、なにげに10進使うなと言ってるのが面白いな
でもこれユニコード本体のエンコードかなんかに追加してくれないと従来処理との切り替えができないから結局使えなくない?
42名無しさん@おーぷん :2018/01/25(木)20:25:12 ID:ukb
そもそもエスケープって文字列リテラルの機能だから、文字コードの仕様に入れるのは変
取り入れたい言語が取り入れればいい
43名無しさん@おーぷん :2018/01/25(木)23:13:20 ID:bva
文字を文字列で表現する機能ではなくて、代替文字表現じゃないかな?
機能コードを前置するから文字列に見えるけどあくまで一つのシーケンスコードが文字化けしてるだけみたいな
44名無しさん@おーぷん :2018/01/27(土)00:47:20 ID:IVV
お前は何を求めてるんだ?
全てのプログラミング言語で同じエスケープ文字の構文を使えるようにしてほしいのか?
現時点だって\nとかはほとんどの言語で使えるし、そこまで求める意味がわからん
45名無しさん@おーぷん :2018/01/27(土)08:48:31 ID:JKg
使えない奴は使えない奴でいいから、使える環境と区別可能にしてほしいな
エスケープシーケンスなんかは端末の種類を指定するものがあるけれども、
C1集合の代替とかはできてもC0つまりエスケープ自身のエスケープが問題だな
46名無しさん@おーぷん :2018/02/17(土)14:25:55 ID:Wct
ファイルはUTF8
内部でUTF16
に統一してたら楽だったのでは?
47名無しさん@おーぷん :2018/02/18(日)07:18:07 ID:lS8
UTF16だとサロゲートペアの問題があるから全部UTF8の方がいい

新着レスの表示 | ここまで読んだ

名前: mail:





文字コード
CRITEO