掘金 人工智能 05月08日 16:03
阿里云 AI 搜索开放平台新增:服务开发能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里云AI搜索开放平台发布新功能,重点解决用户在代码开发中的不便。通过集成DSW能力,新增notebook功能,为用户提供更便捷的代码编写、调试及运行环境,从而提升服务调试体验。平台提供20+原子化服务能力,可灵活组合搭建AI搜索,支持文档和图片解析、文档切片、多语言向量模型、查询分析、搜索引擎、排序以及大模型内容生成等功能。用户可以通过API、SDK调用服务,并可参考内置的最佳实践,快速搭建适配业务需求的搜索链路。

📄文档解析服务:支持多种文档格式的分钟级解析,提取标题、分段等逻辑结构以及文本、表格、图片、代码等信息,并去除页眉页脚等干扰元素,以结构化格式输出。

🖼️图片解析服务:针对架构图、分析图表等图片数据,提供图片内容理解服务,基于多模态大模型或OCR能力解析图片内容和文字,用于图片检索和问答等场景。

🧮多语言向量模型:提供文本向量化服务,支持多种语言、不同输入长度和输出维度的文本向量模型,用于信息检索、文本分类和相似性比较等场景。同时提供稀疏向量化和向量微调服务,优化检索效果和性价比。

🔍查询分析服务与排序服务:提供Query内容分析,进行意图识别、相似问题扩展等,提升RAG场景的检索问答效果。排序服务则通过对Query及DOC的相关性排序,在RAG及搜索场景中找到相关性更高的内容,提升检索和大模型生成的准确率。

🤖大模型内容生成服务:提供多种大语言模型服务,包括DeepSeek全系模型和通义千问系列,以及内置的OpenSearch-通义千问-Turbo大模型,该模型针对RAG检索增强能力进行了微调,降低模型幻觉率。

随着 AI 技术的快速发展,用户对 以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建AI搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。

一、产品能力

1. 文档解析服务

支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标等信息,以结构化的格式输出。

2. 图片解析服务

针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

3. 文档切片服务

提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。

4. 多语言向量模型

5. 查询分析服务

提供Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。

6. 搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。

7. 排序服务

提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。

8. 大模型内容生成服务

提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo通义千问-Plus通义千问-Max大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。

二、产品优势

1. 丰富的 AI 搜索能力:

2. 灵活的调用方式:

3. 开箱即用:

4. 最佳实践:

三、功能使用

1. 创建服务开发实例

详情见:help.aliyun.com/zh/open-sea…

2. 服务开发

当创建的服务开发实例状态为运行中时,可通过以下入口进入 Notebook 开发环境:

四、计费

服务开发能力根据购买的 CPU/GPU 机型,消耗的计算资源计费,CU 单价为1.07元/CU/小时

若完成开发或调试可随时停止开发实例,停止后将暂停计费

对外透出机型:

机型单台机器消耗CU数量单台机器单价(元/小时)
gpu.t4.16g.x116.0717.193
ops.basic1.gi.large0.610.65

部署服务的价格为:CU 单价机型消耗的 CU 数量购买机器个数

如:1台 ops.basic1.gi.large 部署开发服务的价格=1.07元/CU/小时0.611=0.65元/小时

五、结尾

本次阿里云 AI 搜索开放平台服务开发能力的发布,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。

了解更多AI搜索开放平台能力help.aliyun.com/zh/open-sea…

快速登录控制台opensearch.console.aliyun.com/cn-shanghai…

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI搜索 阿里云 Notebook DSW RAG
相关文章