阿里云自然语言处理--词向量(高级版-搜索领域)Quick Start

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。词向量是一种简单有效的将最小语义单元 —— 词转化为数值表示的方法。通过词向量得到的数值表示的形式是高维稠密向量。这种数值表示的特点是语义相近的词(如“红色”和“蓝色”)在向量空间中的位置接近。这种数值表示可以支撑语义相似度计算等具体应用。本文将使用Java CommonSDK演示词向量(高级版-搜索领域)服务的快速调用以供参考。

使用前提与环境准备:服务开通与购买


Step By Step

1.参考API文档与公共参数文档获取相应请求参数

de75cf1a136de0.png

  • 公共参数说明

NjIucG5n.png

2.添加pom依赖

        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-core</artifactId>
            <version>4.5.25</version>
        </dependency>
        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-nlp-automl</artifactId>
            <version>0.0.5</version>
        </dependency>
        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-alinlp</artifactId>
            <version>1.0.16</version>
       </dependency>

2.Code Sample

import com.aliyuncs.CommonRequest;
import com.aliyuncs.CommonResponse;
import com.aliyuncs.DefaultAcsClient;
import com.aliyuncs.IAcsClient;
import com.aliyuncs.exceptions.ClientException;
import com.aliyuncs.exceptions.ServerException;
import com.aliyuncs.profile.DefaultProfile;
import com.google.gson.Gson;


////词向量(高级版-搜索领域)common request 调用示例
public class CixL {
    public static void main(String[] args) {
        // 创建DefaultAcsClient实例并初始化
        DefaultProfile defaultProfile = DefaultProfile.getProfile(
                "cn-hangzhou",
                "XXXXXXXXXX",
                "XXXXXXXXXX");
        IAcsClient client = new DefaultAcsClient(defaultProfile);
        // 创建API请求并设置参数
        CommonRequest request = new CommonRequest();
        // domain和version是固定值
        request.setDomain("alinlp.cn-hangzhou.aliyuncs.com");
        request.setVersion("2020-06-29");
        //action name可以在API文档里查到
        //request.setSysAction("GetWeChSearch");//请求的接口名称
        request.putQueryParameter("Action", "GetWeChSearch");
        //put的参数可以在API文档查看到
        request.putQueryParameter("ServiceCode", "alinlp");
        request.putQueryParameter("Text", "黑米红米手机");
        request.putQueryParameter("TokenizerId", "CONTENT_SEARCH");
        request.putQueryParameter("Size", "50");
        request.putQueryParameter("Type", "char_bigram");
        request.putQueryParameter("Operation", "none");

        try {
            CommonResponse response = client.getCommonResponse(request);
            System.out.println(response.getData());
          /*  String s=decodeUnicode(response.getData());
            System.out.println("s = " + s);
            */

        } catch (ServerException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (ClientException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }


    }

}

3.测试结果

{"RequestId":"CE259AA0-E1C6-59E2-B310-CE357A13CB77","Data":"{\"result\":[{\"vec\":[-4.255651,1.213219,0.856495,-2.481254,-6.729954,-4.621204,3.81372,-3.646455,6.261224,2.897739,-7.853306,8.959368,2.924974,-5.90747,-0.201123,-0.140332,3.453462,6.435987,15.18619,-12.789272,-15.130335,1.940396,4.547978,-5.852042,-2.268499,3.768568,3.712131,-5.357275,-6.458886,-2.420038,-6.991103,2.166123,0.887945,-4.217219,1.425601,4.459507,3.209797,-4.527481,-3.687521,-2.231928,4.786528,0.648383,-5.562904,1.702969,6.448044,-9.640839,-0.886534,-7.3472,6.493456,0.942202],\"id\":\"0\",\"token\":\"黑米\"},{\"vec\":[0.877726,1.132082,-5.613807,-1.900749,-2.861119,-3.00097,7.201826,2.171064,-3.314837,-2.952058,-0.991618,6.162203,3.82002,-7.471853,0.423951,1.299135,-0.782475,-1.448201,4.601281,2.022881,-1.447525,-0.008039,-1.314486,-3.789436,1.136636,3.964592,-4.203924,-1.730252,-0.167399,-2.855152,-3.844211,1.156023,1.579365,1.903898,-0.290805,-0.615354,-0.022376,0.819657,0.60257,-1.84637,-1.732321,-0.917693,-4.257839,1.048397,-0.175411,-3.733828,0.761257,-2.059779,4.980361,-4.397338],\"id\":\"1\",\"token\":\"米红\"},{\"vec\":[-2.17109,-6.290648,6.654186,-0.695609,-6.684472,1.272753,-10.532696,-7.316753,2.945151,-0.390713,-6.769702,0.430509,6.150597,-7.45804,-0.830655,8.035053,0.341639,6.130096,2.560552,-7.763608,-8.621331,-2.012161,7.663877,1.924299,-5.278724,-11.560014,2.8584869999999998,-1.508497,5.385394,-2.583442,-3.02083,-4.309587,-4.322153,1.393944,-0.232543,5.442506,-1.713952,-4.977821,-9.320206,-5.974001,10.831289,3.00543,-0.092997,1.415884,11.286345,3.158252,7.31239,3.16223,3.724459,7.311743],\"id\":\"2\",\"token\":\"红米\"},{\"vec\":[5.484167,-3.345454,9.576895,3.128644,-2.036045,5.894164,-4.155556,-10.793914,-2.21732,1.24183,-3.052969,4.700079,-0.382952,-9.165679,1.97241,3.909209,-7.657845,-0.51583,2.823141,11.308275,-4.581187,-1.95851,-2.084924,1.857948,4.526321,-1.580681,-10.400382,-3.130725,3.226059,-4.436426,-3.833469,-0.705518,-3.069891,3.884865,-2.096954,0.240224,-3.243983,0.342065,-9.406469,2.264706,-0.272858,9.168299,2.368482,-3.943226,7.726858,5.19746,3.176575,0.142443,1.78424,4.876834],\"id\":\"3\",\"token\":\"米手\"},{\"vec\":[-0.718097,-2.606562,-3.545193,-2.429097,-2.177475,-3.349937,-8.537108,-2.910691,-8.09818,2.690675,-0.164936,-17.19929,-1.004841,20.872927,-9.019085,-5.094629,15.284081,-2.161737,3.069172,5.289883,6.404361,-9.231058,33.556217,2.899154,-1.889561,-9.148371,-5.618814,4.126205,-3.169963,9.868908,1.296777,4.085752,-1.285291,-3.509693,0.046204,-7.819964,-5.722138,9.269789,-16.53449,-9.893858,-4.132792,-3.114636,1.219672,6.93671,12.493896,-0.775925,3.457082,-2.403937,7.65632,-2.396141],\"id\":\"4\",\"token\":\"手机\"},{\"vec\":[1.352933,2.36617,2.764187,3.703733,-4.721046,-2.124177,1.277447,2.874165,-1.876756,3.561866,0.141891,4.10538,-4.406244,-6.055981,1.11197,-2.695912,0.050099,-0.37031,3.980693,7.140368,0.542026,-0.714525,1.609959,-0.333711,-0.206534,-1.957111,-2.911337,0.212022,2.697909,0.16504,-3.609034,-3.291612,-3.56242,-1.80904,-1.346586,2.459177,0.659762,5.99373,4.369863,-0.256574,-0.68737,2.203851,-0.226921,1.667175,3.311716,-3.059965,-3.455271,-0.235805,2.850859,-0.680972],\"id\":\"5\",\"token\":\"机\"}],\"success\":true}"}

更多参考

快速入门
API参考-词向量(高级版-搜索领域)
SDK示例
阿里云自然语言处理PHP Core SDK使用Quick Start

目录
相关文章
|
9月前
|
机器学习/深度学习 自然语言处理 数据可视化
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(1)
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(1)
117 0
|
9月前
|
人工智能 自然语言处理 机器人
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(2)
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(2)
96 0
|
10月前
|
机器学习/深度学习 自然语言处理 算法
自然语言处理算法与文档管理软件:提升搜索与分类效率的未来
如果想要让你的文档管理软件更智能、更易用,那就让我们聊一聊如何巧妙地应用自然语言处理(NLP)算法吧!这绝对是提升用户体验和工作效率的“绝佳利器”!下面是一些能帮你通过自然语言处理算法提升文档管理软件的搜索和分类效率的方法——
110 1
|
24天前
|
敏捷开发 缓存 测试技术
阿里云云效产品使用问题之购买高级版云效后,该怎么运营
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
26天前
|
机器学习/深度学习 数据采集 人工智能
Python 高级实战:基于自然语言处理的情感分析系统
**摘要:** 本文介绍了基于Python的情感分析系统,涵盖了从数据准备到模型构建的全过程。首先,讲解了如何安装Python及必需的NLP库,如nltk、sklearn、pandas和matplotlib。接着,通过抓取IMDb电影评论数据并进行预处理,构建情感分析模型。文中使用了VADER库进行基本的情感分类,并展示了如何使用`LogisticRegression`构建机器学习模型以提高分析精度。最后,提到了如何将模型部署为实时Web服务。本文旨在帮助读者提升在NLP和情感分析领域的实践技能。
37 0
|
1月前
|
机器学习/深度学习 自然语言处理 PyTorch
【从零开始学习深度学习】48.Pytorch_NLP实战案例:如何使用预训练的词向量模型求近义词和类比词
【从零开始学习深度学习】48.Pytorch_NLP实战案例:如何使用预训练的词向量模型求近义词和类比词
|
2月前
|
消息中间件 BI Serverless
消息队列推出serverless版、Quick BI升级至5.0……阿里云近期产品动态汇总
消息队列推出serverless版、Quick BI升级至5.0……阿里云近期产品动态汇总
497 1
|
11月前
|
机器学习/深度学习 自然语言处理 算法
深入NLTK:Python自然语言处理库高级教程
在前面的初级和中级教程中,我们了解了NLTK库中的基本和进阶功能,如词干提取、词形还原、n-gram模型和词云的绘制等。在本篇高级教程中,我们将深入探索NLTK的更多高级功能,包括句法解析、命名实体识别、情感分析以及文本分类。
|
机器学习/深度学习 存储 人工智能
《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(上)
《阿里云AI产品必知必会系列电子书》——机器学习平台PAI——DSW Quick Start使用教程(上)
1182 1
|
数据采集 自然语言处理 算法
NLP之相似文本搜索
NLP之相似文本搜索
384 0