题目描述:
给你一个整数数组
citations
,其中citations[i]
表示研究者的第i
篇论文被引用的次数。计算并返回该研究者的h
指数。根据维基百科上 h 指数的定义:
h
代表“高引用次数” ,一名科研人员的h
指数 是指他(她)至少发表了h
篇论文,并且 至少 有h
篇论文被引用次数大于等于h
。如果h
有多种可能的值,h
指数 是其中最大的那个。示例 1:
输入:citations = [3,0,6,1,5]
输出:3
解释:给定数组表示研究者总共有 5篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5次。
由于研究者有 3 篇论文每篇 至少 被引用了 3次,其余两篇论文每篇被引用 不多于 3次,所以她的 h 指数是 3。
示例 2:输入:citations = [1,3,1]
输出:1
解题方法:
排序解法:
- 对给定的引用次数数组进行降序排序,以便更方便地找到高引用次数的论文。
- 遍历排序后的数组,对于每篇论文,判断当前的引用次数是否大于等于当前索引加1。
- 如果满足条件,更新h的值为当前索引加1。
- 如果不满足条件,跳出循环,返回最终的h值。
这个方法的核心思想是通过排序将高引用次数的论文放在前面,然后遍历数组找到最大的h值,即满足至少有h篇论文被引用了h次的条件。排序的时间复杂度是O(nlogn),遍历数组的时间复杂度是O(n),因此总体的时间复杂度是O(nlogn)。
代码:
class Solution { public: int hIndex(vector<int>& citations) { sort(citations.begin(), citations.end()); int h = 0, i = citations.size() - 1; while ( i >= 0 and citations[i] > h){ h++; i--; } return h; } };
总结:
这种方法通过排序提高了查找高引用次数的效率,最终返回的h值即为研究者的h指数。算法的时间复杂度为O(nlogn),其中n是论文的数量。