一般
- 東京 港区「プレクラス制度」来年度 全小学校で導入 都内初|NHK 首都圏のニュース
- 「ゴンドラで刺激臭」通報、神戸 乗客6人が体調不良訴え | 共同通信
- 公民館での飲酒が禁止に、町内会に広がる波紋「交流の機会減る」 広島県府中市(中国新聞デジタル) – Yahoo!ニュース
- ローマ字表記、70年ぶり改定へ意見公募 文化庁が「ヘボン式」案:朝日新聞デジタル
関連:ヘボン式ローマ字 – Wikipedia
あくまでただの「表記」だけの話ならヘボン式の方が良い、というか日本人的にはどうでもよい、と言っていいかもな。
日本人自体はその表記はあまり利用しませんし(読めない漢字とかがあった場合には併記されていれば利用したりはしますが)。
ヘボン式の場合、外国の「音・読み」に向いた表記であって、「文字」(特にデジタル上のデータ)として取り扱う場合は日本語とは相性が悪いんですよね。
例えばPC等でローマ字でキーボード入力する際にIMEがそもそも変換に対応していない。
いや、「し」とかの場合、「si」を「shi」のように文字数を多く入力するようなパターンの場合は対応しているんですよ。
でも文字が削られるケース、例えば有名な文字列で言えば、「とうきょう」(東京とか)の場合「toukyou」は出来るけど、「tokyo」では変換できない
(事前に「読み」で「ときょ」として、変換後の文字の「東京」などをIMEで使う辞書に登録とかしておけば、運用上は可能にはなりますけどね)。
致命的なものだと、「こうぞう」(構造とか)を入力したい場合、「kouzou」は当然変換できるけど、ヘボン式の「kozo」では出来ないし、
小僧寿しとかの「こぞう」(小僧)も「kozou」は出来るが、ヘボン式だと「こうぞう」と同じ文字列の「kozo」になっちゃって区別すら出来なくなる。
そもそもヘボン式が浸透したのも広義の意味では文化侵略なんじゃ? と解釈できる部分だってあるし、
前述のように入力する際の実務で考えた場合も含めて、ヘボン式はどうなんだろうなぁと思うことができる場面はある。
ただグローバル社会として「外国の人」に向けた部分では、外国に馴染みがある表記の方がそりゃ色々と誤解は少なくなるでしょうから良いとは思います。
要は看板とかでの表記や、翻訳する上での合理性や効率性など「output」(アウトプット、出力)ではヘボン式の方が広く見る場合は良いとは思うけど、
一方でその文字列を利用する主に日本人、日本語、データとしての「input」(インプット、入力)の場合はヘボン式じゃない方が良いっていう、
前述のように実務上の向き・不向きがある。
もうちょっと関連を掘り下げると、今はともかくちょっと昔の機械(自動)翻訳で日本語としておかしな文字列が多かったりしたのは、
技術や精度自体もさることながら、ヘボン式の表記などの「ゆれ、ブレ」が要因として含まれるケースも可能性としては考えられる。
機械の場合、いったん何らかの中間言語に変換して、そこを経由して再変換したりしますからね(必ずしも、ではないです)。
例えば、日本語を中国語に翻訳する場合、日本語から直接的に中国語に変換するのではなく、中間言語として英語を採用することにした場合は、
日本語をいったん英語に翻訳して、英語から中国語に変換するみたいな感じ。
そして機械の場合は「音」で処理するのではく、どうしても間にデータとして扱いやすくするために何らかの「文字」に変換する必要が出ますから、
「表記」がヘボン式のようにネイティブの「正確な文字」として一致できないものがあったりすると、翻訳結果もおかしくなりえてしまうんです。
(前述の例のように、中間言語を経てどこかで「こぞ」になってしまったら、「構造(こうぞう)」や「小僧(こぞう)」への再変換はできなくなってしまう。
まぁ精度はともかく今のAIや、生身の人間であれば、文脈から推測して変換することは可能ですけどね。
でも少なくとも変換コストが増えるから、ヘボン式表記がデータとして最適とは言えないのは確かだろう。
この辺は当然だけど、精度や表現上の言葉選びは人間の方がまだ上だ。翻訳が間違っていても読み手に脳内変換してもらう程度でいいなら、今のAIでも十分かもしれませんけどね。)
そういやAIの場合は、中間言語として独自言語を作り上げたケースもあるようで、この辺は調べてみると色々と仕組みが興味深いものがあります。
下記関連はちょっと古くて、最新ではどこまで進化しているか調べてませんが、前にどこかでピックアップしたことがあるもの。
関連(2017年8月):終わりの始まり…? 独自言語で話しはじめた人工知能、Facebookが強制終了させる | ギズモード・ジャパン
関連(2017年11月):「2つのAIが“独自言語”で会話」の真相–FacebookのAI研究開発者が明かす – CNET Japa
下記も過去ピックアップしていたが、現時点ではオリジナルの記事が削除されているようなので、気になる方は自分で探してください。
関連(2016年11月):GoogleのAI翻訳ツールは独自の内部的言語を発明したようだ、そうとしか言えない不思議な現象が | TechCrunch Japan
関連(2016年11月):Google翻訳のAI、未学習の言語ペアも「そこそこ流暢」な翻訳が可能に。言葉の意味を中間言語化、他の言語に適用 – Engadget 日本版
「AI 翻訳 中間言語」とか、いくつかのキーワードで検索すれば、別サイトの記事なら見つけやすいです。
参考(2016年12月):Google翻訳のAIは独自の「中間言語」を習得して「学習してない言語間の翻訳」すら可能な段階に突入 – GIGAZINE
まぁ実際にヘボン式の表記がデータとしてとても増えてしまった場合に、誤翻訳を増やすことになりえてしまわないかという、AIにおける機械学習データへの影響がどこまで出るかは分かりませんけどね。
独自の中間言語を使っていたとしても、それを生み出す、学ぶ過程でヘボン式表記が参照された場合は果たして・・・、という懸念はある。 - タイで迷惑行為、邦人に罰金 小型熱気球、SNSで非難拡散 | 共同通信
火災の危険性や航空機への影響から指定の期間・地域以外で飛ばすことは禁じられている
別に種族が悪いわけではなく、「特定の人」が悪いだけではあるけれど、
それでも外部から見たら「日本人が」という全体での括り、レッテルで評価されうるものですから、
感情的には恥をさらすようなことは止めてもらいたい、とは思います。
日本人だって日本国内で外国人が犯罪を起こした場合、なぜか「その人」よりも、そこの「国(の人)」を非難しますからね。
それは逆に外国で日本人が犯罪をした場合に、日本(人)全体が非難されることと同じだ。
これはどこかの会社に所属する人のケースでも同じだな。人ではなくその所属自体に目を向けられやすい。
会社でも国でもどこかに所属している場合、その所属の外で活動すると、
本人にそのつもりはなくても、いや、実際にそうでなくても、その所属を代表・象徴する一員として見られてしまうものだ。