Question

ある企業の ML エンジニアが、テキスト埋め込み（Text Embedding）を用いたセマンティック検索システムを構築しようとしている。テキスト埋め込みの特性として正しいものはどれか。

Accepted Answer

意味的に類似したテキストは埋め込み空間上で距離が近くなるため、キーワード一致しなくても関連ドキュメントを発見できる

Answer

埋め込み次元数が大きいほど必ず検索精度が向上し、次元数の選択に精度トレードオフはない

Answer

テキスト埋め込みはテキストの文字列を単純に数値化したものであり、意味の類似性は反映されない

Answer

埋め込みベクトルはモデルに依存しない絶対的な表現であり、どのモデルで生成しても互換性がある

ある企業の ML エンジニアが、テキスト埋め込み（Text Embedding）を用いたセマンティック検索システムを構築しようとしている。テキスト埋め込みの特性として正しいものはどれか。

同じ分野の関連問題