一段价值2.4万元的Python代码

简介: 但是有个小伙伴在群里问,有没有什么一夜暴富的方法,这让行哥难以回答,毕竟游戏里的结论是前期积累了资源,就很难再变穷。对应我们的生活世界则是如果有上一代有力的资源支持,也很难变穷。这么想的话,如果上一代没有给予有力的支持,那么最快的暴富方法莫不是


上周行哥发了一篇文章,在里面用游戏案例分析了一下“我们为什么这么穷?”,可谓字字珠玑,每一个游戏案例的观点都深入人心image.png

但是有个小伙伴在群里问,有没有什么一夜暴富的方法,这让行哥难以回答,毕竟游戏里的结论是前期积累了资源,就很难再变穷。对应我们的生活世界则是如果有上一代有力的资源支持,也很难变穷。image.png这么想的话,如果上一代没有给予有力的支持,那么最快的暴富方法莫不是image.png

理智很快敲醒了我,在这个该奋斗的年纪,是真的找不到富婆。。。。image.png

为了解答这位行友,行哥随意在网上搜索了一下,就发现一个小小的商机,希望能给这位行友一些启发

某宝的万能是公认的,也充满了很多零成本的生意。比如我们用掌握的Python语言给别人提供服务,就近乎零成本(只消耗电费和头发)。这不,淘宝上一个小小的PDF转换就有20000人收货,按照挂牌价格计算,价值24000元。如果我们掌握了零成本的转换方法,那么一台顶配外星人是不是到手了。。。image.png

想想就激动,行哥使用了0.0001秒把我之前做过的案例拿出来晒一晒

现在的pdf主要有两种,一种可复制型pdf,这种pdf转换比较简单,直接使用python的pdfminer工具包就可以完成pdf转word、ppt、excel,文件处理不要太方便

另一种是图片型pdf,这种pdf转换比较复杂。上古时代最常用的转换方法就是手打,经过严格训练的打字员,一天内可以转换上百页pdf,不要问行哥是怎么知道的,只是那时候兼职还没有淘宝刷单这回事。后来人工智能火起来,使用OCR+深度学习的技术,图片内识别文字分分钟,虽然速度提升起来但是目前来看大部分转换的准确率还是不如训练有素的打字员。

复制型pdf

这里是将pdf转成word的核心代码,主要使用pdfminer工具包对pdf文件拆分,然后依次转成文本,再拼接和保存文件。一共34行代码,算下来每行代码岂不是价值705元,一种学到就是赚到的感觉。

 

def main():
    fn = open(file_name, 'rb')
    parser = PDFParser(fn)
    doc = PDFDocument()
    parser.set_document(doc)
    doc.set_parser(parser)
    resource = PDFResourceManager()
    laparams = LAParams()
    device = PDFPageAggregator(resource, laparams=laparams)
    interpreter = PDFPageInterpreter(resource, device)
    for i in doc.get_pages():
        interpreter.process_page(i)
        layout = device.get_result()
        for out in layout:
            if hasattr(out, "get_text"):
                content = out.get_text().replace(u'\xa0', u' ')
                document.add_paragraph(
                    content, style='ListBullet'
                )
            document.save('a' + '.docx')
    print('处理完成')

完整代码可以点击阅读全文在行哥免费的知识星球里下载

图片型pdf

图片型pdf转发可是各家厂商的核心机密,虽然后台也可能包含了训练有素的打字员。目前公开用法是利用tesseract-ocr工具包进行光学文字识别。行哥当年实习也开发过这种版本,对于比较规整字体的转换质量还是蛮高的。image.pngimage.png

如果遇到非常杂乱的格式和字体,这需要大量的数据集去训练和识别。必要的时候可以使用百度提供api来进行转换,百度被称为中国AI的黄埔军校,那转换质量是非常高的。

上图的相关代码也可以点击阅读全文在行哥免费的知识星球里下载,或者在公众号的后台回复【一行06】就可以获得

知乎解决答案

正好昨天看到知乎也上热搜了,里面也提供了很多免费转换的方法。image.png所以行哥悄咪咪的使用上次分享的知乎爬虫软件自动爬取了该问题下的所有答案,可惜没有版权只能自己学习,只能让各位行友去我知识星球里或者后下载这款爬虫工具image.png

但是要知道里面无论提供网站和软件,如果遇到大批量pdf文件转换,都无法实现完完全全的永久免费或者自动化转换,还需要自己手动一个个点点点点点。如果遇到这种重复劳动力,行哥还是建议使用代码run一下就好。

行哥说两句

无论Python还是Java等编程语言,都是一个生产力工具。生产力工具能够产生价值,关键就看我们是如何用这个生产工具为自己产生价值。行哥这里有很多案例,我有故事,你有在看吗?

另外,行哥小声bb一下,下一个小赚钱的机会是“头盔”哦



相关文章
|
1月前
|
开发框架 数据建模 中间件
Python中的装饰器:简化代码,增强功能
在Python的世界里,装饰器是那些静悄悄的幕后英雄。它们不张扬,却能默默地为函数或类增添强大的功能。本文将带你了解装饰器的魅力所在,从基础概念到实际应用,我们一步步揭开装饰器的神秘面纱。准备好了吗?让我们开始这段简洁而富有启发性的旅程吧!
38 6
|
2月前
|
存储 缓存 测试技术
Python中的装饰器:功能增强与代码复用的利器
在Python编程中,装饰器是一种强大而灵活的工具,它允许开发者以简洁优雅的方式增强函数或方法的功能。本文将深入探讨装饰器的定义、工作原理、应用场景以及如何自定义装饰器。通过实例演示,我们将展示装饰器如何在不修改原有代码的基础上添加新的行为,从而提高代码的可读性、可维护性和复用性。此外,我们还将讨论装饰器在实际应用中的一些最佳实践和潜在陷阱。
|
9天前
|
Python
课程设计项目之基于Python实现围棋游戏代码
游戏进去默认为九路玩法,当然也可以选择十三路或是十九路玩法 使用pycharam打开项目,pip安装模块并引用,然后运行即可, 代码每行都有详细的注释,可以做课程设计或者毕业设计项目参考
51 33
|
10天前
|
JavaScript API C#
【Azure Developer】Python代码调用Graph API将外部用户添加到组,结果无效,也无错误信息
根据Graph API文档,在单个请求中将多个成员添加到组时,Python代码示例中的`members@odata.bind`被错误写为`members@odata_bind`,导致用户未成功添加。
36 10
|
2月前
|
人工智能 数据挖掘 Python
Python编程基础:从零开始的代码旅程
【10月更文挑战第41天】在这篇文章中,我们将一起探索Python编程的世界。无论你是编程新手还是希望复习基础知识,本文都将是你的理想之选。我们将从最基础的语法讲起,逐步深入到更复杂的主题。文章将通过实例和练习,让你在实践中学习和理解Python编程。让我们一起开启这段代码之旅吧!
|
30天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
69 8
|
1月前
|
API Python
【Azure Developer】分享一段Python代码调用Graph API创建用户的示例
分享一段Python代码调用Graph API创建用户的示例
55 11
|
1月前
|
测试技术 Python
探索Python中的装饰器:简化代码,增强功能
在Python的世界中,装饰器是那些能够为我们的代码增添魔力的小精灵。它们不仅让代码看起来更加优雅,还能在不改变原有函数定义的情况下,增加额外的功能。本文将通过生动的例子和易于理解的语言,带你领略装饰器的奥秘,从基础概念到实际应用,一起开启Python装饰器的奇妙旅程。
44 11
|
1月前
|
Python
探索Python中的装饰器:简化代码,增强功能
在Python的世界里,装饰器就像是给函数穿上了一件神奇的外套,让它们拥有了超能力。本文将通过浅显易懂的语言和生动的比喻,带你了解装饰器的基本概念、使用方法以及它们如何让你的代码变得更加简洁高效。让我们一起揭开装饰器的神秘面纱,看看它是如何在不改变函数核心逻辑的情况下,为函数增添新功能的吧!
|
1月前
|
程序员 测试技术 数据安全/隐私保护
深入理解Python装饰器:提升代码重用与可读性
本文旨在为中高级Python开发者提供一份关于装饰器的深度解析。通过探讨装饰器的基本原理、类型以及在实际项目中的应用案例,帮助读者更好地理解并运用这一强大的语言特性。不同于常规摘要,本文将以一个实际的软件开发场景引入,逐步揭示装饰器如何优化代码结构,提高开发效率和代码质量。
51 6