SharePoint 2013 对二进制大型对象(BLOB)进行爬网

简介:   本文是参考MSDN文档做的示例,SharePoint 2013搜索二进制对象(BLOB),通过外部内容类型的方式将外部数据与SharePoint相关联,修改BCD模型,使SharePoint能够爬网外部数据中的文件流。

  本文是参考MSDN文档做的示例,SharePoint 2013搜索二进制对象(BLOB),通过外部内容类型的方式将外部数据与SharePoint相关联,修改BCD模型,使SharePoint能够爬网外部数据中的文件流。

  步骤,首先就是使用SPD创建外部内容类型,并为外部内容类型添加各种操作;然后,将BCD模型导出,添加方法后重新导入;最后,配置爬网,对外部内容类型进行爬网。

1、首先,用Designer 2013打开站点,点击左上角按钮,创建外部内容类型;

clip_image001

2、输入外部内容类型的名称,点击“单击此处发现外部数据并定义操作”;

clip_image002

3、在外部内容类型的操作设计器中,点击添加连接;

clip_image003

4、而后的外部数据源类型选择SQL Server;

clip_image004

5、再然后填写SQL Server连接的相关属性,如下图添加,即可:

clip_image005

6、如下图,添加连接以后,会显示数据库相关表和视图,下面,我们创建所有操作;

clip_image006

7、如下图,可以看到创建、读取项、更新、删除、读取列表等操作,当然,某些情况,我们也会一一创建,这里为了省事儿,我一起创建;

clip_image007

8、可以看到我们数据源的元素,我们全部显示出来,并且ID是主键,点击下一步;

clip_image008

9、进入筛选器参数配置,如下图,我们点击添加筛选器参数,参见步骤10:

clip_image009

10、如下图,添加筛选器后,选中,点击右侧的“单击以添加”,弹出“筛选器配置”对话框,选中限制,点击确定,而后在右侧默认值选中1000;

clip_image010

  特:要说明的是,这个限制是防止返回大量数据的,如果限制了1000,数据量超过1000后会报错,需要修改这个设置;

11、创建完毕后,点击完成,查看下图:可以看到外部内容类型的操作和字段;

clip_image011

12、创建完毕后,选中导出BCD模型,如下图,点击确定,选中路径,保存即可;

clip_image012

13、使用VS打开导出的BCD模型,方便编辑;

clip_image013

  特别:如果你对于BCD模型不是很熟悉,建议先看看文章后面附的MSDN链接,多理解下每个节点,大致有什么意思。哪里是属性,哪里是变量声明,哪里是方法,这样对于配置起来,会事半功倍的。

14、修改导出的BCD模型,添加新的方法,用来爬网BLOB;

clip_image014

15、修改完成后,进入管理中心,删除现有的BCD模型,导入我们修改以后的,如下图:

clip_image015

16、进入搜索应用程序,添加内容源,并对内容源进行完全爬网;

clip_image016

17、查看爬网日志;

clip_image017

  详细日志

clip_image018

18、测试搜索程序;

clip_image019

  如博客介绍,SharePoint 2013搜索BLOB,如果可以行程解决方案,对搜索SharePoint系统外数据库中的文件,会有很大的帮助,本文参考MSDN文档,如有任何问题,可以参照附录的文档查看。

  好了,就这样吧,好歹搞一搞,就又该睡觉了,还好今天还算有收获,大家晚安~~

修改BCD模型添加的方法的Xml

<Method Name="GetData">

<Properties>

<Property Name="RdbCommandText" Type="System.String">SELECT FileDate FROM T_BlobDate where ID=@ID</Property>

<Property Name="RdbCommandType" Type="System.Data.CommandType, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089">Text</Property>

</Properties>

<Parameters>

<Parameter Direction="In" Name="@ID">

<TypeDescriptor TypeName="System.Int32" IdentifierName="ID" Name="ID" />

</Parameter>

<Parameter Name="StreamData" Direction="Return">

<TypeDescriptor TypeName="System.Data.IDataReader, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" IsCollection="true" Name="StreamData">

<TypeDescriptors>

<TypeDescriptor TypeName="System.Data.IDataRecord, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" Name="StreamData Element">

<TypeDescriptors>

<TypeDescriptor TypeName="System.Byte[]" Name="FileDate" />

</TypeDescriptors>

</TypeDescriptor>

</TypeDescriptors>

</TypeDescriptor>

</Parameter>

</Parameters>

<MethodInstances>

<MethodInstance Name="FileDate" ReturnParameterName="StreamData" Type="StreamAccessor" ReturnTypeDescriptorPath="StreamData[0].FileDate" Default="true">

<Properties>

<Property Name="MimeTypeField" Type="System.String">ContentType</Property>

<Property Name="FileNameField" Type="System.String">DisplayName</Property>

</Properties>

</MethodInstance>

</MethodInstances>

</Method>

外部内容类型的数据库库结构

clip_image020

参考链接

如何:基于 SQL Server 表创建外部内容类型

http://msdn.microsoft.com/zh-cn/library/office/ee557243.aspx

如何:在 SharePoint 中创建外部列表

http://msdn.microsoft.com/zh-cn/library/office/ee558778.aspx

如何:在 SharePoint 2013 中对二进制大型对象 (BLOB) 进行爬网

http://msdn.microsoft.com/zh-cn/library/office/gg294168.aspx

XML Snippet: Modeling a StreamAccessor Method

http://msdn.microsoft.com/en-us/library/ff464410.aspx

目录
相关文章
|
14天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
6天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
9天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
846 25
|
8天前
|
机器学习/深度学习 人工智能 搜索推荐
万字长文深度解析最新Deep Research技术:前沿架构、核心技术与未来展望
近期发生了什么自 2025 年 2 月 OpenAI 正式发布Deep Research以来,深度研究/深度搜索(Deep Research / Deep Search)正在成为信息检索与知识工作的全新范式:系统以多步推理驱动大规模联网检索、跨源证据。
581 46
|
2天前
|
监控 BI 数据库
打工人救星!来看看这两家企业如何用Quick BI让业务更高效
Quick BI专业版监控告警助力企业高效运作,通过灵活配置规则与多渠道推送,让数据异常早发现、快响应,推动业务敏捷决策与持续增长。
打工人救星!来看看这两家企业如何用Quick BI让业务更高效
|
8天前
|
人工智能 Java Nacos
基于 Spring AI Alibaba + Nacos 的分布式 Multi-Agent 构建指南
本文将针对 Spring AI Alibaba + Nacos 的分布式多智能体构建方案展开介绍,同时结合 Demo 说明快速开发方法与实际效果。
563 42