暂无个人介绍
ApacheZeppelin 是基于Web的Notebook,支持交互式数据分析。您可以使用SQL,Scala等创建漂亮的数据驱动,交互式和协作文档。
公司中的开发一般是沿着一种核心开发语言如Java、C/C++、PHP进行相关开发。但由于产品新需求、项目新需要,免不了会使用自己不擅长的语言开发。甚至,现在全栈工程师也比比皆是。对于经验不丰富的职场人,如何开展工作呢?
一键构造待采集批量sql语句
本文针对libevent从服务端、客户端两个角度实现了封装类,真正做到,我们在使用封装类时候,只需要关注业务逻辑的处理,不需要关注socket的通信的细节。
偶然的原因用了Gephi画关系图,并解决了其中遇到的一些问题。Gephi在大数据绘图方面的优势和可视化效果非常震撼,特总结备忘如下。
实际应用开发中遇到:将非格式化的文件数据存储到数据库中。对于传统的格式化的数据:ini/json/xml我们都有现成的类库去实现。而对于如下非格式化的数据呢?以下是我的思考与实现。
实际开发环境中,前端程序需要在给定时间段内,将数据更新/插入到mysql指定的库表中。随着数据量的增多,基础库表基数的增长,每更新一次都会有5s左右的卡顿。 本文来了几种解决方案,请到文中寻找吧!
仅就沟通的问题,我做了如下的思考与总结。
最高新的的技术、最强的干货,最易读的案例,就在《运维周刊》!
优酷从Hadoop迁移到阿里云MaxCompute后对业务及平台的价值。
有没有比较快速的方式实现Mysql与Oracle之间的同步?
想要一键下载外文文献吗?快来这里吧!
本文是logstash_output_mongodb插件用途及安装详解
本文主要实现将Elasticsearch中的索引数据Index同步到Mongodb中的集合collection中。
近日,阿里 AI 开源了新一代人机对话模型 ESIM。该算法模型提出两年多,已被包括谷歌、facebook 在内的国际学术界在200多篇论文中引用,更曾在国际顶级对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的世界纪录提升至94.1%。
本文主要讲解Elasticsearch下实现索引迁移的几种方式。
本文基于导出时间长的问题,说下数据库表的设计和多表关联需要注意的事情!
定时检测服务状态脚本实现
本文仅对官网考点部分进行翻译、提炼、考点难度评定星级
淘宝最近开源的 Midway 框架在新的场景、新的体系下如何和现有的 Egg 体系保持良好的兼容性。
自定义脚本完成性能测试
各种 Attention ,终于不再迷惑。
本文主要讲解Mongodb的类型转换。包括:string转double, string转int, string转Date。
理清楚关系型/非关系型数据库与Elasticsearch同步
之前Elasticsearch的应用集中在关系型、非关系型数据库与Elasticsearch之间的同步。完成了Elasticsearch所需要的基础数据量的供给。想要在海量的数据中找到和自己相关的业务数据,实现对已有的数据实现全文检索、分类统计等功能并应用到业务系统中,须借助Java API来实现。
1、题记 之前应用都是Elasticsearch单节点,随着业务的拓展、数据量的增多,部署分布式Elasticsearch刻不容缓。 本文以Elaticsearch2.3.4版本为基础,讲解Elasticsearch三个节点的分布式部署、核心配置的含义以及分布式部署遇到的坑。
本文是Elasticsearch5.4.0(head/kibana/logstash)安装部署深入的详解。
Apache OpenOffice是一款先进的开源 办公软件套件,Jodconverter是一个JAVA的OpenDocument**文件转换器,利用OpenOffice可以进行多种文档格式之间的转换,它可以被用做**JAVA库,命令行工具,或者一个WEB应用。
本文详解Elasticsearch5.4.0 IK分词插件安装
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!
本文给出架构设计和实现原理。
《懒人Shell脚本》之九
centos6.8 安装python3/pip3/sqlite3详解
docker环境部署的时候,有过运行失败及网络不可用等各种问题,以下命令都是摸索出来的。
随着业务量的增加,docker部署数量增多,会有很大的磁盘占用,慢慢/var/lib/docker就很容易占满了。 此时,对docker存储进行迁移势在必行!
软考信息系统项目管理工程师(信管高级)涉及9大知识管理体系,要理解记忆,没有捷径可走。
一次同步多张表是开发中的一般需求。我再次整理了一下。
本文主要介绍,如何将格式化的Json文件批量插入到ES中。
学习ES的童鞋,都有一个开发一个类似百度的搜索引擎的想法。那么问题来了,该如何实现?需要什么技术呢?
OCRmyPDF使用最好的可用开源OCR引擎Tesseract执行OCR。 OCRmyPDF是一个Python 3包,将OCR图层处理结果添加到PDF。 OCRmyPDF是功能最丰富且经过彻底测试的OCR PDF转换工具。
Jest是Elasticsearch 的Java Http Rest 客户端。
openoffice4 不能正常启动终极解决方案请小伙伴们查收。
Elasticsearch中当我们设置Mapping(分词器、字段类型)完毕后,就可以按照设定的方式导入数据。有了数据后,我们就需要对数据进行检索操作。检索子句的行为取决于查询应用于过滤(filter)上下文还是查询/分析(query)上下文。
这是一个被我称之为“没有枪、没有炮,硬着头皮自己造”的项目
不懂JAVA得小伙伴们不用怕,给大家带来了关于JAVA的基础知识清单,请放心学习。
《懒人Shell脚本》之十
本文清单内容参考了ES官网文档,且都是在ES5.4.0的环境中验证过的,请放心阅览使用。
本文,详细记录了大文件的全文检索性能问题排查及提升实践方式。
思考:Elasticsearch单字段支持的最大字符数?详解设置ignore_above之后引申的问题。
详解| docker ce 使用及两台docker集群通信配置