あると便利な気がして Python スクリプトで作成しましたが。
👉 GitHub Emoji Unicode Full Emoji List - shortcode | code point | escape-sequence
AndroidStudio や IDEA Intellij では \uXXXX\uXXXX
のような絵文字などの「Unicode Escape Sequence (エスケープシーケンス)」の記述をエディタからできますよね。
// Kotlin
println("Hello, world!")
println("\ud83d\udca4")
実行すると意図した絵文字が表示されます。
しかし、Python では、実行ができません。
# Python
print("Hello, world!")
print("\ud83d\udca4")
エラーメッセージは以下。
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 0-1: surrogates not allowed
2つのエスケープシーケンスでそれぞれ試してみます。
💤
\U0001f4a4
\ud83d\udca4
// Kotlin
// Illegal escape: '\U'
// println("\U0001f4a4")
// OK
println("\ud83d\udca4")
# Python
# OK
print("\U0001f4a4")
# UnicodeEncodeError:
# 'utf-8' codec can't encode characters in position 0-1: surrogates not allowed
print("\ud83d\udca4")
😄 まとめ
エスケープシーケンスをコードに記述する場合、
Kotlin:
"\uXXXX\uXXXX"
Python:
"\UXXXXXXXX"
を使うと良い。
それぞれ、桁数(X)は、4桁、8桁で固定。
足りなければ、0 でパディング。
GitHub Emoji Unicode Full Emoji List - shortcode | code point | escape-sequence
👉 https://t.co/o4cKi20TwW#emoji #unicode #プログラミング #python #swift #kotlin— chanzmao (@maochanz) May 21, 2023
【Kotlin】絵文字を含む Unicode 文字列の文字数をカウントする方法と文字ごとの構成 https://t.co/Ge1cKTLiSn #unicode #programming #kotlin #android
— chanzmao (@maochanz) May 29, 2023
【Python】絵文字を含む Unicode 文字列の文字数をカウントする方法と文字ごとの構成要素 https://t.co/oNKbGFeHyk #プログラミング #Python
— chanzmao (@maochanz) May 29, 2023