阿里云自然语言处理--词向量(高级版-搜索领域)Quick Start

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。词向量是一种简单有效的将最小语义单元 —— 词转化为数值表示的方法。通过词向量得到的数值表示的形式是高维稠密向量。这种数值表示的特点是语义相近的词(如“红色”和“蓝色”)在向量空间中的位置接近。这种数值表示可以支撑语义相似度计算等具体应用。本文将使用Java CommonSDK演示词向量(高级版-搜索领域)服务的快速调用以供参考。

使用前提与环境准备:服务开通与购买


Step By Step

1.参考API文档与公共参数文档获取相应请求参数

de75cf1a136de0.png

  • 公共参数说明

NjIucG5n.png

2.添加pom依赖

        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-core</artifactId>
            <version>4.5.25</version>
        </dependency>
        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-nlp-automl</artifactId>
            <version>0.0.5</version>
        </dependency>
        <dependency>
            <groupId>com.aliyun</groupId>
            <artifactId>aliyun-java-sdk-alinlp</artifactId>
            <version>1.0.16</version>
       </dependency>

2.Code Sample

import com.aliyuncs.CommonRequest;
import com.aliyuncs.CommonResponse;
import com.aliyuncs.DefaultAcsClient;
import com.aliyuncs.IAcsClient;
import com.aliyuncs.exceptions.ClientException;
import com.aliyuncs.exceptions.ServerException;
import com.aliyuncs.profile.DefaultProfile;
import com.google.gson.Gson;


////词向量(高级版-搜索领域)common request 调用示例
public class CixL {
    public static void main(String[] args) {
        // 创建DefaultAcsClient实例并初始化
        DefaultProfile defaultProfile = DefaultProfile.getProfile(
                "cn-hangzhou",
                "XXXXXXXXXX",
                "XXXXXXXXXX");
        IAcsClient client = new DefaultAcsClient(defaultProfile);
        // 创建API请求并设置参数
        CommonRequest request = new CommonRequest();
        // domain和version是固定值
        request.setDomain("alinlp.cn-hangzhou.aliyuncs.com");
        request.setVersion("2020-06-29");
        //action name可以在API文档里查到
        //request.setSysAction("GetWeChSearch");//请求的接口名称
        request.putQueryParameter("Action", "GetWeChSearch");
        //put的参数可以在API文档查看到
        request.putQueryParameter("ServiceCode", "alinlp");
        request.putQueryParameter("Text", "黑米红米手机");
        request.putQueryParameter("TokenizerId", "CONTENT_SEARCH");
        request.putQueryParameter("Size", "50");
        request.putQueryParameter("Type", "char_bigram");
        request.putQueryParameter("Operation", "none");

        try {
            CommonResponse response = client.getCommonResponse(request);
            System.out.println(response.getData());
          /*  String s=decodeUnicode(response.getData());
            System.out.println("s = " + s);
            */

        } catch (ServerException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (ClientException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }


    }

}

3.测试结果

{"RequestId":"CE259AA0-E1C6-59E2-B310-CE357A13CB77","Data":"{\"result\":[{\"vec\":[-4.255651,1.213219,0.856495,-2.481254,-6.729954,-4.621204,3.81372,-3.646455,6.261224,2.897739,-7.853306,8.959368,2.924974,-5.90747,-0.201123,-0.140332,3.453462,6.435987,15.18619,-12.789272,-15.130335,1.940396,4.547978,-5.852042,-2.268499,3.768568,3.712131,-5.357275,-6.458886,-2.420038,-6.991103,2.166123,0.887945,-4.217219,1.425601,4.459507,3.209797,-4.527481,-3.687521,-2.231928,4.786528,0.648383,-5.562904,1.702969,6.448044,-9.640839,-0.886534,-7.3472,6.493456,0.942202],\"id\":\"0\",\"token\":\"黑米\"},{\"vec\":[0.877726,1.132082,-5.613807,-1.900749,-2.861119,-3.00097,7.201826,2.171064,-3.314837,-2.952058,-0.991618,6.162203,3.82002,-7.471853,0.423951,1.299135,-0.782475,-1.448201,4.601281,2.022881,-1.447525,-0.008039,-1.314486,-3.789436,1.136636,3.964592,-4.203924,-1.730252,-0.167399,-2.855152,-3.844211,1.156023,1.579365,1.903898,-0.290805,-0.615354,-0.022376,0.819657,0.60257,-1.84637,-1.732321,-0.917693,-4.257839,1.048397,-0.175411,-3.733828,0.761257,-2.059779,4.980361,-4.397338],\"id\":\"1\",\"token\":\"米红\"},{\"vec\":[-2.17109,-6.290648,6.654186,-0.695609,-6.684472,1.272753,-10.532696,-7.316753,2.945151,-0.390713,-6.769702,0.430509,6.150597,-7.45804,-0.830655,8.035053,0.341639,6.130096,2.560552,-7.763608,-8.621331,-2.012161,7.663877,1.924299,-5.278724,-11.560014,2.8584869999999998,-1.508497,5.385394,-2.583442,-3.02083,-4.309587,-4.322153,1.393944,-0.232543,5.442506,-1.713952,-4.977821,-9.320206,-5.974001,10.831289,3.00543,-0.092997,1.415884,11.286345,3.158252,7.31239,3.16223,3.724459,7.311743],\"id\":\"2\",\"token\":\"红米\"},{\"vec\":[5.484167,-3.345454,9.576895,3.128644,-2.036045,5.894164,-4.155556,-10.793914,-2.21732,1.24183,-3.052969,4.700079,-0.382952,-9.165679,1.97241,3.909209,-7.657845,-0.51583,2.823141,11.308275,-4.581187,-1.95851,-2.084924,1.857948,4.526321,-1.580681,-10.400382,-3.130725,3.226059,-4.436426,-3.833469,-0.705518,-3.069891,3.884865,-2.096954,0.240224,-3.243983,0.342065,-9.406469,2.264706,-0.272858,9.168299,2.368482,-3.943226,7.726858,5.19746,3.176575,0.142443,1.78424,4.876834],\"id\":\"3\",\"token\":\"米手\"},{\"vec\":[-0.718097,-2.606562,-3.545193,-2.429097,-2.177475,-3.349937,-8.537108,-2.910691,-8.09818,2.690675,-0.164936,-17.19929,-1.004841,20.872927,-9.019085,-5.094629,15.284081,-2.161737,3.069172,5.289883,6.404361,-9.231058,33.556217,2.899154,-1.889561,-9.148371,-5.618814,4.126205,-3.169963,9.868908,1.296777,4.085752,-1.285291,-3.509693,0.046204,-7.819964,-5.722138,9.269789,-16.53449,-9.893858,-4.132792,-3.114636,1.219672,6.93671,12.493896,-0.775925,3.457082,-2.403937,7.65632,-2.396141],\"id\":\"4\",\"token\":\"手机\"},{\"vec\":[1.352933,2.36617,2.764187,3.703733,-4.721046,-2.124177,1.277447,2.874165,-1.876756,3.561866,0.141891,4.10538,-4.406244,-6.055981,1.11197,-2.695912,0.050099,-0.37031,3.980693,7.140368,0.542026,-0.714525,1.609959,-0.333711,-0.206534,-1.957111,-2.911337,0.212022,2.697909,0.16504,-3.609034,-3.291612,-3.56242,-1.80904,-1.346586,2.459177,0.659762,5.99373,4.369863,-0.256574,-0.68737,2.203851,-0.226921,1.667175,3.311716,-3.059965,-3.455271,-0.235805,2.850859,-0.680972],\"id\":\"5\",\"token\":\"机\"}],\"success\":true}"}

更多参考

快速入门
API参考-词向量(高级版-搜索领域)
SDK示例
阿里云自然语言处理PHP Core SDK使用Quick Start

目录
相关文章
|
12月前
|
机器学习/深度学习 自然语言处理 数据可视化
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(1)
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(1)
151 0
|
12月前
|
人工智能 自然语言处理 机器人
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(2)
掌握 BERT:自然语言处理 (NLP) 从初级到高级的综合指南(2)
118 0
|
机器学习/深度学习 自然语言处理 算法
自然语言处理算法与文档管理软件:提升搜索与分类效率的未来
如果想要让你的文档管理软件更智能、更易用,那就让我们聊一聊如何巧妙地应用自然语言处理(NLP)算法吧!这绝对是提升用户体验和工作效率的“绝佳利器”!下面是一些能帮你通过自然语言处理算法提升文档管理软件的搜索和分类效率的方法——
124 1
|
2月前
|
自然语言处理
【NLP】如何实现快速加载gensim word2vec的预训练的词向量模型
本文探讨了如何提高使用gensim库加载word2vec预训练词向量模型的效率,提出了三种解决方案:保存模型以便快速重新加载、仅保存和加载所需词向量、以及使用Embedding工具库代替word2vec原训练权重。
131 2
|
2月前
|
机器学习/深度学习 自然语言处理 数据可视化
自然语言处理 Paddle NLP - 词向量应用展示
自然语言处理 Paddle NLP - 词向量应用展示
27 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
Python 高级实战:基于自然语言处理的情感分析系统
**摘要:** 本文介绍了基于Python的情感分析系统,涵盖了从数据准备到模型构建的全过程。首先,讲解了如何安装Python及必需的NLP库,如nltk、sklearn、pandas和matplotlib。接着,通过抓取IMDb电影评论数据并进行预处理,构建情感分析模型。文中使用了VADER库进行基本的情感分类,并展示了如何使用`LogisticRegression`构建机器学习模型以提高分析精度。最后,提到了如何将模型部署为实时Web服务。本文旨在帮助读者提升在NLP和情感分析领域的实践技能。
98 0
|
4月前
|
机器学习/深度学习 自然语言处理 PyTorch
【从零开始学习深度学习】48.Pytorch_NLP实战案例:如何使用预训练的词向量模型求近义词和类比词
【从零开始学习深度学习】48.Pytorch_NLP实战案例:如何使用预训练的词向量模型求近义词和类比词
|
机器学习/深度学习 自然语言处理 算法
深入NLTK:Python自然语言处理库高级教程
在前面的初级和中级教程中,我们了解了NLTK库中的基本和进阶功能,如词干提取、词形还原、n-gram模型和词云的绘制等。在本篇高级教程中,我们将深入探索NLTK的更多高级功能,包括句法解析、命名实体识别、情感分析以及文本分类。
|
自然语言处理 API
调用阿里云NLP自学习平台API时,缺少了一个必需的参数
调用阿里云NLP自学习平台API时,缺少了一个必需的参数
269 1
|
机器学习/深度学习 人工智能 编解码
NLP领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ACL 2023
阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。
下一篇
无影云桌面