文本转换为向量有多种方式:
方法一:
(推荐)方法二:
方法三:
方法四:
本文介绍方法三:如何通过
将文本转换为向量,并入库至向量检索服务DashVector中进行向量检索。DashVector:
已创建Cluster:
已获得API-KEY:
已安装最新版SDK:
Jina AI
已获得API密钥:
Jina Embeddings v2模型,唯一支持 8192 个词元长度的开源向量模型,在大规模文本向量化基准 (MTEB) 的功能和性能方面与 OpenAI 的闭源模型 text-embedding-ada-002 相当。
模型名称 |
向量维度 |
度量方式 |
向量数据类型 |
备注 |
jina-embeddings-v2-small-en |
512 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-en |
768 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-zh |
768 |
Cosine |
Float32 |
|
说明
关于Jina Embeddings v2模型更多信息请参考:
说明
需要进行如下替换代码才能正常运行:
DashVector api-key替换示例中的{your-dashvector-api-key}
DashVector Cluster Endpoint替换示例中的{your-dashvector-cluster-endpoint}
Jina AI api-key替换示例中的{your-jina-api-key}
Python示例: