开发者社区> 问答> 正文

Github趋势榜第一:2020新冠肺炎记忆

新冠肺炎这是一段在人们心中无法遗忘的历史,现在正在不断的向我们展现它的一切;或者应该说,这世界上的所有人,现在此时此刻,正在不断的完善这段历史。

本项目收录了2020年新型冠状病毒肺炎(中国卫健委命名 Novel Coronavirus Pneumonia, NCP;WHO 命名 COVID-19)相关媒体报道、非虚构作品和亲历者个人叙述,将持续更新。

希望这一选编有助于理解疫情及其影响下的每一个人,并帮助相关研究者(如自然语言处理、疫情防治)做初步的资料收集。项目地址

分类及收录标准:

  • 报道和非虚构写作:详尽细致或角度新颖,且来自较可信赖的媒体或公众号,尤其是对一线、基层(不只是最受关注的,而是包括各地、各群体、各行业)的非虚构写作和描述性报道。有少量摄影报道。作者不是文中的叙述者或受访者。

  • 亲历者个人叙述:疫情影响下的个体记录其见闻和思考的文章。文中的叙述者是作者本人。主要来自微信公众号。

  • 不收录评论、分析、科普等类别的作品。

项目结构

├─archive                          文章的存档,目前提供jpg格式
│  └─jpg
│    ├─1.jpg
│    └─...
├─data                             csv格式的文章数据
│  └─data.csv
├─docs                             一个用于展示README的 Github Page
├─gh-page
├─template                         README模板
│  └─README.handlebars
├─utils                            构建README的工具
│  ├─generateReadmeFromCsv.js
│  └─...
└─README.md                        主文档

项目的意义

这次的疫情已经成为了一场全民“战疫”,我们从没有停止过对疫情的讨论。

我们会为在疫情中失去生命的人员痛惜,为医护人员和抗疫一线人员的奉献精神所感动,而我们能做到的只需要自我隔离,随时佩戴戴口罩,这些虽然都是我们力所能及的小事儿,但我们每一个人都在为抗疫胜利而努力。

GitHub 上的这个项目,正好可以利用 AI 来分析网站、新闻报道和社交媒体中关于新型冠状肺炎的报道,通过自然语言处理来解析社交媒体上发布的文本,根据新闻发生的先后顺序,来分析真新闻、假新闻,分析事件之间直接或间接的联系,从而得出一些结论和归因。这些信息对于专业的认识和团队一定有更多、更大的用途。

对于这次疫情控制工作,相关的信息已经变得越来越透明,我们期待看到更多的好消息和正面消息,但对于事件中那些可能做的不好的地方,都可以成为我们记录的回忆。也为后人提供了一份有价值的参考。

也欢迎大家成为贡献者,共同记录这一段回忆。

技术交流群

加入阿里云钉钉群享福利:每周技术直播,定期群内有奖活动、大咖问答

image

展开
收起
珍宝珠 2020-02-14 19:39:11 4406 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
浙大杨洋教授PPT:社交网络中的群体用户行为分析与表示学习 立即下载
《技术的乌托邦还是商业的潘多拉魔盒?》比特币研究报告 立即下载
开源项目 OpenGene 发起人:用“互联网+基因技术”改变肿瘤的诊断与治疗 立即下载