biostar handbook: 第二周笔记汇总+第三周任务布置

简介: 第二周已经结束了,我不确定大家对Linux到底了解到了什么程度,但是我觉得再给一周时间让初学者去熟悉Linux肯定是必要的。于是这一周的任务不会太难,只需要让大家去理解本体论(ontology)。

第二周已经结束了,我不确定大家对Linux到底了解到了什么程度,但是我觉得再给一周时间让初学者去熟悉Linux肯定是必要的。于是这一周的任务不会太难,只需要让大家去理解本体论(ontology)。

笔记汇总

这周有一些小伙伴开始遭遇人生抉择,有一些则是要出差赶路,所以上交作业不算太多。可能大家对自己的要求有点高了,其实我一直强调的是笔记的不断迭代,只要你写了一点内容就可以发出来,后来不断修改,趋于完善。

任务布置

本周的学习任务是第五章。我们不求多,不求快,只要稳扎稳打,所以就只要学习这一章。但是下一周的任务,我有种要一次性学习6~9章的内容。不过不用慌,这一次就第五章。

作为一位大学统计棉花表皮毛的苦逼生物狗,深刻体会什么叫做经验,也就是人类模式识别能力的强大和不精确性。当时的导师教我如何根据表皮毛的长短和浓密进行基因型的判定,但是我一直纠结长和短,密和疏之间的分界。在读研的时候,师姐会让我提供基因Genomic序列,这来自于TAIR的定义,此外TAIR还定义了full length cDNA和full length CDS。我经常纠结这些序列和我GFF里面的CDS,mRNA,gene的关系是什么?直到我把所有序列都拿出来,进行多序列联配才发现它们之间的差异。

计算机科学来自于多学科的交互,比如说数学,语言学,逻辑学等。为了保证互联网的通信,代码的复用,API的调用等,计算机协会制定了很多协议进行标准化。比如说“意思意思”这句话在中文的语境千变万化,但是在计算机里面可能就会翻译成mean of mean。为了能让计算机分析生物数据,就要生物学的一些概念进行精确定义,而不是“只可意会,不可言传”

Unfortunately, biological terminology is notoriously ambiguous; the same word is often used to describe more than one thing and there are many dialects. For example, does a coding sequence (CDS) contain the stop codon or is the stop codon part of the 3'-untranslated region (3' UTR)?

There really is no right or wrong answer to such questions, but consistency is crucial when attempting to compare annotations from different sources, or even when comparing annotations performed by the same group over an extended period of time.

因此,大家需要去理解一下什么叫做基因本体论,还有序列本体论,也就是gff文件里面的其中两列内容。

然后你就开始尝试去理解什么叫做富集分析。也就是别人要你去做富集分析,计算机做的事情是啥。这会涉及到一些统计学知识,比如说超几何分布,你就可以去翻翻教科书了。这部分内容请参考Y叔和Jimmy激烈交流的故事。

最后用unix的命令行分析你研究物种的gff文件,问题则是靠你自己提出了,比如说最多的feature是什么?

目录
相关文章
|
2月前
|
存储 算法 Python
【10月更文挑战第16天】「Mac上学Python 27」小学奥数篇13 - 动态规划入门
本篇将通过 Python 和 Cangjie 双语介绍动态规划的基本概念,并解决一个经典问题:斐波那契数列。学生将学习如何使用动态规划优化递归计算,并掌握编程中的重要算法思想。
102 3
|
2月前
|
Python
【10月更文挑战第8天】「Mac上学Python 16」小学奥数篇2 - 分糖果问题
本篇将通过 Python 和 Cangjie 双语解决一个经典的数学问题:如何将糖果平分给小朋友。这道题目将帮助初学者通过编程理解循环与条件判断的结合使用。
85 2
ACM刷题之路(二十)线筛素数+找规律f(n) 2019暑期集训 HDU 2585
ACM刷题之路(二十)线筛素数+找规律f(n) 2019暑期集训 HDU 2585
|
机器学习/深度学习 人工智能 JavaScript
|
存储 算法
每日一题冲刺大厂第八天 二叉树深度
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题这个月进度是数据结构,让大家练到各种各样的数据结构题目,熟悉数据结构的增删改查,一年以后,蜕变成为一个不一样的自己!
108 0
|
机器学习/深度学习 算法
每日一题冲刺大厂第十三天 海港
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题这个月进度是数据结构,让大家练到各种各样的数据结构题目,熟悉数据结构的增删改查,一年以后,蜕变成为一个不一样的自己!
211 0
|
算法
每日一题冲刺大厂 第二十二天 喝咖啡
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题为了让大家练到各种各样的题目,熟悉各种题型,一年以后,蜕变成为一个不一样的自己!
119 0
|
算法
每日一题冲刺大厂 第二十四天 开心的金明
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题为了让大家练到各种各样的题目,熟悉各种题型,一年以后,蜕变成为一个不一样的自己!
103 0
|
机器学习/深度学习
假期福利 | 林轩田《机器学习基石》资源汇总
假期福利 | 林轩田《机器学习基石》资源汇总
200 0
假期福利 | 林轩田《机器学习基石》资源汇总