新冠肺炎这是一段在人们心中无法遗忘的历史,现在正在不断的向我们展现它的一切;或者应该说,这世界上的所有人,现在此时此刻,正在不断的完善这段历史。
本项目收录了2020年新型冠状病毒肺炎(中国卫健委命名 Novel Coronavirus Pneumonia, NCP;WHO 命名 COVID-19)相关媒体报道、非虚构作品和亲历者个人叙述,将持续更新。
希望这一选编有助于理解疫情及其影响下的每一个人,并帮助相关研究者(如自然语言处理、疫情防治)做初步的资料收集。项目地址
分类及收录标准:
报道和非虚构写作:详尽细致或角度新颖,且来自较可信赖的媒体或公众号,尤其是对一线、基层(不只是最受关注的,而是包括各地、各群体、各行业)的非虚构写作和描述性报道。有少量摄影报道。作者不是文中的叙述者或受访者。
亲历者个人叙述:疫情影响下的个体记录其见闻和思考的文章。文中的叙述者是作者本人。主要来自微信公众号。
不收录评论、分析、科普等类别的作品。
项目结构
├─archive 文章的存档,目前提供jpg格式
│ └─jpg
│ ├─1.jpg
│ └─...
├─data csv格式的文章数据
│ └─data.csv
├─docs 一个用于展示README的 Github Page
├─gh-page
├─template README模板
│ └─README.handlebars
├─utils 构建README的工具
│ ├─generateReadmeFromCsv.js
│ └─...
└─README.md 主文档
项目的意义
这次的疫情已经成为了一场全民“战疫”,我们从没有停止过对疫情的讨论。
我们会为在疫情中失去生命的人员痛惜,为医护人员和抗疫一线人员的奉献精神所感动,而我们能做到的只需要自我隔离,随时佩戴戴口罩,这些虽然都是我们力所能及的小事儿,但我们每一个人都在为抗疫胜利而努力。
GitHub 上的这个项目,正好可以利用 AI 来分析网站、新闻报道和社交媒体中关于新型冠状肺炎的报道,通过自然语言处理来解析社交媒体上发布的文本,根据新闻发生的先后顺序,来分析真新闻、假新闻,分析事件之间直接或间接的联系,从而得出一些结论和归因。这些信息对于专业的认识和团队一定有更多、更大的用途。
对于这次疫情控制工作,相关的信息已经变得越来越透明,我们期待看到更多的好消息和正面消息,但对于事件中那些可能做的不好的地方,都可以成为我们记录的回忆。也为后人提供了一份有价值的参考。
也欢迎大家成为贡献者,共同记录这一段回忆。
加入阿里云钉钉群享福利:每周技术直播,定期群内有奖活动、大咖问答
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。