みんな大好き絵文字「👍」で。
👉 GitHub Emoji Unicode Full Emoji List - shortcode | code point | escape-sequence
👍 Unicode エスケープシーケンス
s = '\\U0001f44d' # r'\U0001f44d'
print(s)
# \U0001f44d
print(s.encode().decode('unicode-escape'))
# 👍
print(eval(f'"{s}"').encode().decode('unicode-escape'))
# ð
「Unicode エスケープシーケンス」から「文字」に変換するには、
'\\U0001f44d'.encode().decode('unicode-escape')
でいけます。
👍 UTF-16 エスケープシーケンス
同様に、
s = '\\ud83d\\udc4d' # r'\ud83d\udc4d'
print(s)
# \ud83d\udc4d
print(s.encode('utf-16', 'surrogatepass').decode('utf-16'))
# \ud83d\udc4d
print(eval(f'"{s}"').encode('utf-16', 'surrogatepass').decode('utf-16'))
# 👍
「UTF-16 エスケープシーケンス」から「文字」に変換するには、
eval('"\\ud83d\\udc4d"').encode('utf-16', 'surrogatepass').decode('utf-16')
でいけます。
👍 まとめ
ややこしいです。他にいい方法ないかな。
【Kotlin】絵文字を含む Unicode 文字列の文字数をカウントする方法と文字ごとの構成 https://t.co/Ge1cKTLiSn #unicode #programming #kotlin #android
— chanzmao (@maochanz) May 29, 2023
【Python】絵文字を含む Unicode 文字列の文字数をカウントする方法と文字ごとの構成要素 https://t.co/oNKbGFeHyk #プログラミング #Python
— chanzmao (@maochanz) May 29, 2023
【Unicode】UTF-16 サロゲートぺア と コードポイント の変換
👉 https://t.co/SpEH1fDLXt#プログラミング #python #swift #kotlin— chanzmao (@maochanz) May 24, 2023
Python vs Kotlin Unicode Escape Sequence (エスケープシーケンス) の記述
👉 https://t.co/Tz5HvOPD7Q#プログラミング #kotlin #python— chanzmao (@maochanz) May 23, 2023
GitHub Emoji Unicode Full Emoji List - shortcode | code point | escape-sequence
👉 https://t.co/o4cKi20TwW#emoji #unicode #プログラミング #python #swift #kotlin— chanzmao (@maochanz) May 21, 2023