Unicode と つなみ
Unicode と つなみ (UnicodeAndNuclear) is simplified (and perhaps grammatically-correct) version of story UnicodeAndTsunamiJ in interpretation by ChatGPT.
The story arises as an example to support the Tarja language. Tarja is system of writing texts while avoiding visually ambiguous Unicode characters (with aims to ensure that every symbol has a distinct appearance in the default font).
The story is about Unicode characters
X5927 大 and
X2F24 ⼤.
The Japanese words below are intentionally separated with spacebar (Ascii character number 32) in order to simplify the learning of Japanese.
In the text below, the complicated and/or not so popular and/or confusive Kanjis are replaced to Hiragana.
With goals of simplicity, the plot of the story deviates from the original. For this reason the story is loaded here as a separate article.
The article is copipasted below with minimal TORIfication.
🌊 Unicode と つなみ (空想科学 小話)
まえがき
この話 は 空想 です。
歴史 的 事実 では ありません。
Unicode の 文字 が どのように まちがい を まねく か を しめす ため に 書かれました。
1. まえの はなし
日本 の 東海岸 に、原子力発電所 が ありました。
発電所 は 大きく、安全 でした。
多く の サーバー が Linux で 動いていました。
データベース には 「安全」 と 書かれた 文字 が ありました。
その 文字 は 「大」 に にていました が、じつは Unicode の べつ の 記号 でした。
U+5927 と U+2F24 ― 目 では ほとんど 同じ です。
フォント に よって は まったく 同じ に 見える こと も あります。
2. 災害
ある日、大きな じしん が おこりました。
すべて の 原子炉 は 自動 的 に とまりました。
非常用発電機 が うごき、ポンプ に 電気 を おくって 原子炉 を 冷やしました。
しかし、その プログラム は 「大」 という 文字 を さがして いました。
ファイル 名 には 「⼤」 が 使われていました。
見た目 は おなじ でも、コード が ちがいました。
システム は その ファイル を 見つけられません でした。
冷却 が 止まり、温度 が 上がりました。
原子炉 は こわれ、つなみ に よって、まわり の 町 が こわれました。
3. 教訓
この ように、Unicode の 文字 が ちがう だけ で、大きな まちがい が おこる こと が あります。
フォント に よって は、U+2F24 と U+5927 が まったく 同じ に 見える こと も あります。
人間 が 見て 同じ に 見えても、コンピューター は ちがう 文字 として あつかいます。
だから、文字 と プログラム の あいだ に は、注意 が ひつよう です。
4. おわりに
この 物語 は、技術 の あやふや さ を しめす たとえ話 です。
「フォント の ちがい」 や 「文字コード の まちがい」 は、ただ の 表示 の 問題 では ありません。
ときには、大きな 事故 の 原因 に なる かもしれません。
小さな まちがい でも、注意 すれば 防げます。
Why this version works
Keeps your short, didactic style.
Uses only simple kanji (no rare ones).
Keeps ASCII for “Unicode,” “U+5927,” “U+2F24,” etc.
Adds natural flow and consistent grammar.
Keeps the “Tarja” spaces enough for machine parsing but not too many.
(End of copipast of the text by ChatGPT.)
Warnings
The story is loaded in order to lean Japanese. And, perhaps, Tarja.
The story is loaded in order to learn the Unicode (and, in particular, the Japanese Kanjis).
The story is loaded in order to learn, that can we expect from ChatGPT.
The story is neither a manual on nuclear physics nor a result of a research on history of Japan of century 21.
If you see any contradictions in the story above, then, please, address the ChatGPT, not to Editor of TORI.
If you want to criticize the Editor, then, please, address articles
UnicodeAndTsunamiJ (Simplified Japanese version) and/or
EarthquakesAndTsunamis (English version).
There should be many misprints and other errors there.
The critics is welcomed.
The articles loaded in TORI are redundant; the same or similar content may repeat many times. This overlapping is necessary to reveal the possible internal contradictions in the TORI concepts. (With the similar goal, the areas of applicability of the primary approximations of special holomorphic functions overlap; this overlapping helps to reveal the bugs in the numerical implementations.) Hope for your understanding.
References
https://util.unicode.org/UnicodeJsps/character.jsp?a=2F24 2F24 KANGXI RADICAL BIG Han Script confuse: 大
https://util.unicode.org/UnicodeJsps/character.jsp?a=5927 5927 CJK UNIFIED IDEOGRAPH-5927 Han Script confuse: ⼤ ..
https://ja.wikipedia.org/wiki/Unicode Unicode(ユニコード)とは、ユニコードコンソーシアムによって定められた文字コードの標準規格である。符号化文字集合や文字符号化方式などを定め、文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。
https://en.wikipedia.org/wiki/CJK_Compatibility_Ideographs CJK Compatibility Ideographs is a Unicode block created to contain mostly Han characters that were encoded in multiple locations in other established character encodings, in addition to their CJK Unified Ideographs assignments, in order to retain round-trip compatibility between Unicode and those encodings. However, it also contains 12 unified ideographs sourced from Japanese character sets from IBM. ..
https://en.wikipedia.org/wiki/Fukushima_nuclear_accident On March 11, 2011, a major nuclear accident started at the Fukushima Daiichi Nuclear Power Plant in Ōkuma, Fukushima, Japan. The direct cause was the Tōhoku earthquake and tsunami, which resulted in electrical grid failure and damaged nearly all of the power plant's backup energy sources. The subsequent inability to sufficiently cool reactors after shutdown compromised containment and resulted in the release of radioactive contaminants into the surrounding environment.[8]: 56–58 The accident was rated seven (the maximum severity) on the International Nuclear Event Scale by Nuclear and Industrial Safety Agency, following a report by the JNES (Japan Nuclear Energy Safety Organization).[9][10] It is regarded as the worst nuclear incident since the Chernobyl disaster in 1986,[11] which was also rated a seven on the International Nuclear Event Scale.[12] ..
https://ja.wikipedia.org/wiki/福島第一原子力発電所事故 福島第一原子力発電所事故(ふくしまだいいちげんしりょくはつでんしょじこ、英: Fukushima Daiichi nuclear disaster)は、2011年3月11日に発生した東北地方太平洋沖地震とそれに伴う津波により、東京電力の福島第一原子力発電所で発生した原子力事故。1986年4月のチェルノブイリ原子力発電所事故以来、最も深刻な原子力事故となった。国際原子力事象評価尺度(INES)において、7段階レベルのうち、当初はレベル5に分類されたが、後に最高となるレベル7(深刻な事故)に引き上げられた。なお、レベル7に分類されている事故は、チェルノブイリ原子力発電所事故と、福島第一原子力発電所事故の2つのみとなっている[1][2]。
https://en.wikipedia.org/wiki/Iodine_pit The iodine pit, also called the iodine hole or xenon pit, is a temporary disabling of a nuclear reactor due to the buildup of short-lived neutron poisons in the reactor core. The main isotope responsible is 135Xe, mainly produced by beta decay of 135I. 135I is a weak neutron absorber, while 135Xe is the strongest known neutron absorber. When 135Xe builds up in the fuel rods of a reactor, it significantly lowers their reactivity, by absorbing a significant amount of the neutrons that provide the nuclear reaction. ..
https://en.wikipedia.org/wiki/Unicode Unicode (also known as The Unicode Standard and TUS[1][2]) is a character encoding standard maintained by the Unicode Consortium designed to support the use of text in all of the world's writing systems that can be digitized. Version 17.0[A] defines 159,801 characters and 172 scripts[3] used in various ordinary, literary, academic, and technical contexts. ..
https://jciv.iidj.net/map/ Japan Radiation Map. (Updated daily at least since y.2012)
Keywords
«Ascii», «Chikara», «Confusion», «Earthquake», «EarthquakesAndTsunamis», «Earthquakes And Tsunamis», «Fukushima disaster», «Iodine pit», «Japan», «Japanese», «Kanji», «KanjiLiberal», «KanjiRadical», «Letter to Emperor», «Nichi», «Tarja», «Tsunami», «Tsunami stone», «UnicodeAndTsunamiJ», «X2F24» «⼤», «X2F3C» «⼼», «X5927» «大», «X5FC3» «心», «Цунами», «此処より下に家を建てるな», «浪記念碑津大»,