问题一:我请教下机器学习PAI 阿里巴巴国际站 1688.com 淘宝 天猫 她们的搜索原理是一致的吧?
我请请教下机器学习PAI 搜索专家
给我澄清下我的疑惑[老板]
世面上太多跳大神了
1 阿里巴巴国际站 1688.com 淘宝 天猫 她们的搜索原理是一致的吧?
只是b2b平台更粗糙 是吗?
2 商品关键词,同样的关键词,写2遍是没有用的,对吧?
3 标题中的词序,只影响买家阅读体验,不影响系统在商品排序时的权重,对吧?
参考答案:
楼主你好,看了你的问题,我来聊两句,阿里巴巴国际站1688.com、淘宝和天猫的搜索原理类似,但也存在一定差异,而且不同的平台可能对搜索算法的权重、数据来源、排序规则等方面有所不同,因为它们面向的用户群体和商品类型不同。
因为在商品关键词的搜索中,重复写关键词可能会降低搜索的效果,还有标题中的词序,对搜索引擎来说是有影响的。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/574301
问题二:机器学习PAI的1.6.1开源包依旧不全怎么办
机器学习PAI的1.6.1开源包依旧不全怎么办
参考答案:
配置下scala
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/574204
问题三:机器学习PAI这个全表统计的结果二维表,我如何写到output?
这个全表统计的结果二维表,我如何写到output?比如像其他BatchOperator一样我可以linkTo到mysql表?
https://alinklab.cn/manual/summarizerbatchop.html
参考答案:
要将机器学习PAI全表统计的结果二维表写入output,你可以按照以下步骤进行操作:
- 首先,确保你已经安装了机器学习PAI(也称为MaxCompute或ODPS)的开发环境。
- 在你的代码中,使用适当的编程语言和库连接到机器学习PAI平台。具体的连接方式取决于你使用的编程语言和开发环境。
- 执行你的全表统计查询,并将结果存储在一个二维表中。这可以通过编写适当的SQL查询语句来实现。例如,如果你要统计名为"my_table"的表中的数据,可以使用以下SQL查询语句:
SELECT column1, column2, ... FROM my_table;
- 这将返回一个包含指定列的结果集。
- 将查询结果存储在合适的数据结构中,如一个二维数组或列表。具体的实现方式取决于你使用的编程语言和库。
- 最后,将结果写入output。根据你的需求,可以选择将结果输出到文件、数据库或其他目标位置。具体的写入方式取决于你使用的编程语言和库。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/574188
问题四:机器学习PAI啥时候升级支持flink15.x?
机器学习PAI啥时候升级支持flink15.x?
参考答案:
楼主你好,据我所知,目前阿里云机器学习PAI已经支持Flink 1.11版本,但是目前还不确定是否会支持Flink 1.5版本,你可以留意关注阿里云官方的相关公告和更新。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/574184
问题五:有没有人知道机器学习PAI 的Alink怎么实现大量数据两两计算相关性?
有没有人知道Alink怎么实现大量数据两两计算相关性,就是我已有大量文件两两匹配好了,想每两个输出一个相关性结果,单线程计算太慢了,所以想看看spark或者flink有没有啥好的解决方案,本来打算用spark的,但是rdd中没法嵌套rdd,而我看ALink的介绍,相关性算子CorrelationBatchOp好像也是单线程的,我设置了 BatchOperator.setParallelism(4);好像也没啥用,想在flink stream的算子中使用CorrelationBatchOp好像也不行
参考答案:
可以看看向量最近邻https://www.yuque.com/pinshu/alink_doc/vectornearestneighbortrainbatchop 。 或者写个多线程调用
关于本问题的更多回答可点击进行查看: