• 关于

    识别信息如何玩

    的搜索结果

回答

1、利用爬虫技术抓取公司用户信息 公司有15k员工,办公系统的hr模块,只要有部门级的管理人员权限就可以看自己部门的几百名员工资料,包括历年历月的工资条和具体个人信息。关键是,网页地址上有员工编号,如果改一下编号理论上就可以看到部门之外的任意员工资料,包括老总的(老总的编号很普通,并不是想当然的100001)。如果搞个爬虫,想泡妞的人估计就有福气了,呵呵。 2011年夏天,我在google实习的时候做了一些Twitter数据相关的开发,之后我看到了一篇关于利用Twitter上人的心情来预测股市的论文。实习结束后,我跟几个朋友一起商量,看看能不能一起做做Twitter的数据挖掘。于是写了个爬虫玩玩,让Wimbledon意想不到的是,最后开发了两年多,抓取了7一千多用户的400亿条tweet。 2、分析网站用户,预测美女 爬了某网站12万用户的头像,把长得像的头像放在一起。然后搜集了知友们的点击,预测出来这是你们(平均)最喜欢的人长的样子。然后根据点击数据训练出来了一个带逛机器人,可以自动识别美女。 爬虫技术可以抓取到淘宝天猫京东订单页的数据,不过你需要具备特别的抓取技巧,这其中,最难的是如何绕过或者说击败淘宝和京东的安全策略以及反爬虫策略!而且淘宝和京东貌似迭代很快,三五天就一个新版本。需要持续维护这个爬虫。总之,只要你的爬虫够人性化就可以。没有抓不到的数据,只有不努力的爬虫,不过需要注意的是,,淘宝京东这种都是有专门的反爬虫部门的。 3、网络爬虫技术在商业银行的应用 对商业银行而言,网络爬虫技术的应用将助力商业银行实现四个“最了解”,即“最了解自身的银行”、“最了解客户的银行”、“最了解竞争对手的银行”和“最了解经营环境的银行”,具体应用场景如下。包括网络舆情监测、客户全景画像、竞争对手分析、行业垂直搜索。 其中客户全景画像指的是网络爬虫系统对客户相关信息进行实时采集、监测、更新,不仅可以更全面地了解客户实时情况,而且可以对客户的潜在营销商机和信用风险进行预判,有效提升客户营销和贷后风险管理效率,提升商业银行综合效益,形成银行与客户共赢的局面。 4、用“爬虫”技术窃小说供人阅览 有这样一个案例,用“爬虫”技术,福建籍任晓锦等5人事先把多个小说网站的链接存在服务器上,当手机用户登录APP,搜索相关小说时,搜索需求就会迅速反馈到服务端,并通过软件“抓取”小说网站的数据传送到客户端,供用户阅读或下载。不用花费一分钱版权费,任晓锦等非法获取各类小说达5000部以上。不过利用“爬虫”技术窃小说供人阅览,这是违法行为,最终这5人被绳之于法。鉴于此种行为危害较大,各位程序员还是且行且珍惜。 这些爬虫技术的运用,很多都是违法的哦,各位程序员们还是需要谨慎。其实爬虫技术还可以做很多更加牛逼哄哄的事情,欢迎大家来补充!

有只黑白猫 2020-01-15 11:55:51 0 浏览量 回答数 0

回答

回 楼主(codingfish) 的帖子 您好!请问你报名的哪场比赛? 已经到评测时间了吗? 如果到了评测时间,在赛题详情页,左边导航的地方就有个“提交结果”的导航,和 赛题数据、FAQ、论坛并列下来的。 ------------------------- 回 1楼(秋涵) 的帖子 CSV文件就是逗号分隔符文件,不需要依赖于天池平台来操作生成。 EXCEL即可(有文件类型选择的);或者你直接把比赛页面上的那个选手提交样例下载下来,把你的结果内容粘贴进去,然后再提交即可。 再或者,你的数据现在文本文件里,改下扩展名,也可以的,注意下编码格式,选择UTF-8的。 ------------------------- 回 4楼(寒叶峰) 的帖子 https://tianchi.aliyun.com/video.htm 天池- 一级导航“学习” - 视频 或者 置顶帖 https://bbs.aliyun.com/read/273638.html  中这部分 “二、新手入门视频震撼来袭:数据大神手把手带你玩比赛” ------------------------- 回 4楼(寒叶峰) 的帖子 比赛详情页 https://tianchi.aliyun.com/getStart/introduction.htm?raceId=231522也有给链接哦! [attachment=98751] 3.学习文档&培训课程的链接 : https://bbs.aliyun.com/read/273638.html 弱弱问下:是不是大家都没有看赛制的习惯啊?还是因为别的什么原因?谢谢! ------------------------- 回 7楼(寒叶峰) 的帖子 本地的如何配置环境 比如Ubuntu是哪个版本 运行的IDE是哪个版本这样的具体信息,就是从零开始搭建环境 —— 你想搭建什么环境呢? 你搭建环境的目的是?(也就是为解决什么问题的?) 我不大理解你的需求哈。 ------------------------- 回 10楼(寒叶峰) 的帖子 如果只是这个需求,并不需要搭什么复杂的环境啊。 你只需要按照赛题要求,预测出哪些人会购买哪些商品,形成一个包含有user_id和item_id的csv文件,然后通过网站上传即可。 至于如何预测,那就是赛题要考核的内容, https://bbs.aliyun.com/read/273638.html 这里的简要课程有助于你对于赛题的理解,以及如何去训练建模,和预测。 如果是离线赛(本地)做的话,你可以通过数据库、python、Java或者R等等,不一一列举。 ------------------------- 回 10楼(寒叶峰) 的帖子 “在如下网页上传后能被识别”—— 你是不是现在遇到没法上传的问题呢?网页报错?还是格式不满足CSV? ------------------------- 回 14楼(fed) 的帖子 棒棒哒~~

秋涵 2019-12-02 02:55:40 0 浏览量 回答数 0

问题

安卓与iOS百问,开发者系统指南

yq传送门 2019-12-01 20:14:48 27317 浏览量 回答数 26

回答

1.产品2.UI3.CSS4.JS5.后端(Java/php/python)6.DBA(mysql/oracle)7.运维(OP) 8.测试(QA)9.算法(分类/聚类/关系抽取/实体识别)10.搜索(Lucene/Solr/elasticSearch)11.大数据工程师(Hadoop)12.Android13.IOS14.运营 一.产品1 工作内容:了解用户需求,做竞品调研,画产品原型,写产品文档,讲解产品需求,测试产品Bug,收集用户反馈,苦练金刚罩以防止程序员拿刀砍。2 需要技能:PPT,Word, Axure,XP,MVP,行业知识,沟通。 二. UI1 工作内容:收到产品原型,给原型上色,偶尔会自作主张调整下原型的位置,出不同的风格给老板和客户选,然后听他们的意见给出一个自己极不喜欢的风格,最好给Android,IOS或者是CSS做好标注,还有的需要直接帮他们切好图,最后要练出来象素眼,看看这些不靠谱的程序员们有没有上错色或者是有偏差。2 需要技能:PS,Illustrator,Sketch,耐性,找素材。 三. CSS1 工作内容:产品设计好原型,UI做出来了效果图,剩下的就是CSS工程师用代码把静态文件写出来的。 2 需要技能:环境【IDE(WEBStorm,Sublime,EditPlus),源码管理(SVN/Git) ,WEB服务器(nginx)】基础【PS,域名,Html,Html5,CSS,CSS3】扩展【自适应,响应式,Bootstrap,Less,Flex】 四 .JS 1 工作内容:JS工程师其实分成两类,在之前讲CSS的时候已经提到过,一个是套页面的,一个是前后端分离的。对这两个概念还是分不太清的,可以回过头去看CSS的部分。 2 需要技能:环境【IDE(WEBStorm,Sublime,EditPlus),源码管理(SVN/Git) ,WEB服务器(nginx)】基础【Http,REST,跨域,语法,组件,F12,Json,Websocket】框架【JQuery,AngularJS,Bower,RequireJS,GruntJS,ReactJS,PhoneGap】业务【金融,教育,医疗,汽车,房产等等等等各种行业】 五 .后端(Java/python/go) 1 工作内容:大部分的后端工程师都停留在功能实现的层面上。这是现在国内二流或者是三流的公司的现状,甚至是在某些一流的公司。很多时候都是架构师出了架构设计,更多的外包公司根本就是有DBA来做设计,然后后端程序员从JS到CSS到Java全写,完全就是一个通道,所有的复杂逻辑全部交给DB来做,这也是几年前DBA很受重视的原因。 2 需要技能:环境【IDE(Idea/Eclipse,Maven,jenkins,Nexus,Jetty,Shell,Host),源码管理(SVN/Git) ,WEB服务器(nginx,tomcat,Resin)】基础【Http,REST,跨域,语法,Websocket,数据库,计算机网络,操作系统,算法,数据结构】框架【Spring,AOP,Quartz,Json TagLib,tiles,activeMQ,memcache,redis,mybatis,log4j,junit等等等等等】业务【金融,教育,医疗,汽车,房产等等等等各种行业】。 六 .DBA  1 工作内容:如果你做了一个DBA,基本上会遇到两种情况。一种是你的后端工程师懂架构,知道怎么合便使用DB,知道如何防止穿透DB,那么恭喜你,你只是需要当一个DB技术兜底的顾问就好,基本上没什么活可以做,做个监控,写个统计就好了。你可以花时间在MongoDB了,Hadoop了这些,随便玩玩儿。再按照我之前说的,做好数据备份。如果需求变动比较大,往往会牵涉到一些线上数据的更改,那么就在发布的时候安静的等着,等着他们出问题。。。。如果不出问题就可以回家睡觉了。 2 需要技能:环境【Linux,Mysql,Oracle,MongoDB,Hadoop】工具【各种DB的版本,工具,备份,日志等】。 七. 运维  1 工作内容:运维的工作大概分成几个部分,我对于修真院学习运维的少年们都这么说,大概是:A。基础环境的搭建和常用软件的安装和配置(兼网管的还有各种程控机),常用软件指的是SVN,Git,邮箱这种,更细节的内容请参考修真院对于运维职业的介绍。B。日常的发布和维护,如刚刚讲到的一样,测试环境和线上环境的发布和记录,原则上,对线上所有的变更都应该有记录。C。数据的备份和服务的监控&安全配置。各种数据,都要做好备份和回滚的手段,提前准备好各种紧急预案,服务的监制要做好。安全始终都是不怎么被重点考虑的问题,因为这个东西无底洞,你永远不知道做到什么程度算是比较安全了,所以大多数都是看着情况来。D。运维工具的编写。这一点在大的云服务器商里格外常见,大公司也是一样的。E。Hadoop相关的大数据体系架构的运维,确实有公司在用几百台机器做Hadoop,所以虽然不常见,我还是列出来吧。 2 需要技能:环境【Linux,Mysql,Oracle,MongoDB,Hadoop,nginx,apache,F5,lvs,vpn,iptable,svn,git,memcache,redis】工具【linux 常用工具,Mysql常用工具,Jenkins,zabbix,nagios】自动化运维【openstack,docker,ansible】语言【shell,python】 八 .QA  1 工作内容:QA需要了解需求,很多公司会要求QA写测试用例,我觉得是扯淡。完全是在浪费时间。通常开发三周,QA测试的时间只有一周到一周半。还有关于提前写测试用例的,都不靠谱。 2 需要技能:流程【Bug修复流程,版本发布流程】工具【禅道,BugZilla,Jira,Excel表格来统计Bug数,自动化测试】性格【严谨,耐心】 九. 算法工程师  1 工作内容:算法工程师的工作内容,大部分时间都是在调优。就是调各种参数和语料,寻找特征,验证结果,排除噪音。也会和Hadoop神马的打一些交道,mahout神马的,我那个时候还在用JavaML。现在并不知道有没有什么更好用的工具了。有的时候还要自己去标注语料---当然大部分人都不爱做这个事儿,会找漂亮的小编辑去做。2 需要技能:基础【机器学习,数据挖掘】工具【Mahout,JavaML等其他的算法工具集】 十. 搜索工程师  1 工作内容: 所以搜索现在其实分成两种。一种是传统的搜索。包括:A。抓取 B。解析C。去重D。处理E。索引F。查询另一种是做为架构的搜索。并不包括之前的抓取解析去重,只有索引和查询。A。索引B。查询 2 需要技能:环境【Linux】框架【Luence,Slor,ElasticSearch,Cassandra,MongoDB】算法【倒排索引,权重计算公式,去重算法,Facet搜索的原理,高亮算法,实时索引】 十一. 大数据工程师  1 工作内容:工作内容在前期会比较多一些,基础搭建还是一个挺讲究的事儿。系统搭建好之后呢,大概是两种,一种是向大数据部门提交任务,跑一圈给你。一种是持续的文本信息处理中增加新的处理模块,像我之前说的增加个分类啦,实体识别神马的。好吧第一种其实我也不记得是从哪得来的印象了,我是没有见到过的。架构稳定了之后,大数据部门的工作并不太多,常常会和算法工程师混到一起来。其他的应该就是大数据周边产品的开发工作了。再去解决一些Bug什么的。2 需要技能:环境【Linux】框架【Hadoo,spark,storm,pig,hive,mahout,zookeeper 】算法【mapreduce,hdfs,zookeeper】。 十二. Android工程师  1 工作内容:Android工程师的日常就是听产品经理讲需求,跟后端定接口,听QA反馈哪款机器不兼容,闹着申请各种测试机,以及悲催的用Android做IOS的控件。 2 需要技能:环境【Android Studio,Maven,Gradle】基础【数据结构,Java,计算机网络】组件【IM,地图,支付,拍照,视频,音频,统计,分享,手势密码】 十三. IOS工程师  1 工作内容:IOS工程师的工作内容真的挺简单的,听需求,定接口。做个适配,抛弃一下iphone4。还有啥。。马丹,以我为数不多的IOS知识来讲,真的不知道还有啥了。我知道的比较复杂的系统也是各种背景高斯模糊,各种渐变,各种图片滤镜处理,其他并没有什么。支付,地图,统计这些东西。 嗯。2 需要技能:环境【Xcode】基础【数据结构,Object,计算机网络】组件【IM,地图,支付,拍照,视频,音频,统计,分享,手势密码】

行者武松 2019-12-02 01:21:45 0 浏览量 回答数 0
阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板