这里的小浣熊不是咱们耳熟能详的干脆面,而是商汤的办公小浣熊——基于商汤大语言模型的大模型原生数据分析产品,旨在通过先进的人工智能技术优化和提升工作效率。
办公小浣熊已经为数十万用户提供智能辅助服务,获得了广泛的好评。在实际应用中,办公小浣熊广泛应用于日常数据分析、财务分析、商业分析、销售预测、市场分析等多个领域,为用户提供了强大的支持。
一、注册登录
1、注册登录之后,就可以看到两种小浣熊——代码和办公。选择办公小浣熊。
2、需要选择一种数据源进行分析,支持本地文件.xlsx/.xls/.csv/.txt/json/word(beta)/pdf(beta)/ppt(beta)/sql(限免)/图片(限免) 等类型文件。也可以导入数据库文件和数据管理。单次≤3个文件,单个文件≤20M,单个会话≤10个文件/80M。
二、数据分析
1、根据上传的Excel文件进行数据分析。上传一个试题库,然后让小助手对试题进行简单分析。
2、左侧边生成代码边进行分析,大概3分钟左右就可以归类分析。内容如下:
3、接着可以让小助手把分析结果生成图表展示。
4、可以看到单选题的分布生成是空白的,有些问题,这里可以让小助手再重新生成下。这样就比文字更加直观了。
5、可以继续更改图表的参数,包括图表大小、颜色方案以及添加了网格线,以提高可读性和美观性。
6、接着上传一份自己的工作任务表格,让小助手帮忙给我统计下每一类活动的时间长度。
7、小助手会对表格里的内容自行检查。如下:
在检查了Excel文件中的各个工作表后,我发现"activities list"和"Sheet3"包含了活动类型(Activity - Type)和工时(Activity - Duration)的数据。这些数据适合用于按活动类型进行分类分析工时。 接下来,我将使用"activities list"工作表中的数据来进行这项分析。这个工作表包含了活动类型和相应的工时数据,正好符合我们的需求。我将计算每种活动类型的总工时。
8、之后会生成Python代码来进行分析。
# 使用 "activities list" 工作表进行分析 activities_df = pd.read_excel(file_path, sheet_name='activities list') # 确保工时数据是时间格式 activities_df['Activity - Duration'] = pd.to_timedelta(activities_df['Activity - Duration']) # 计算每种活动类型的总工时 total_duration_by_type = activities_df.groupby('Activity - Type')['Activity - Duration'].sum() # 将总工时转换为小时 total_hours_by_type = total_duration_by_type.dt.total_seconds() / 3600 total_hours_by_type
若要对这个代码进行修改,可以全选,然后引用。输入修改代码,小助手就会对代码进行优化。
9、针对不规则的数据,小助手还会进行数据的统一格式进行处理,工时数据列包含了多种格式的时间值,例如 '17:30', '02:00', '04:00' 等,以及一些 NaN 值。这些时间值看起来是以小时和分钟的格式表示的,但没有遵循统一的 hh:mm:ss 格式。
小助手通过下面的Python代码将这些时间值转换为统一的 hh:mm:ss 格式,然后再进行总工时的计算。
# 将工时数据转换为统一的 hh:mm:ss 格式 def convert_to_hh_mm_ss(duration): if pd.isna(duration): return None parts = duration.split(':') if len(parts) == 2: hours, minutes = parts return f"{int(hours):02d}:{int(minutes):02d}:00" return duration activities_df['Activity - Duration'] = activities_df['Activity - Duration'].apply(convert_to_hh_mm_ss) # 再次尝试将转换后的数据转换为时间格式 activities_df['Activity - Duration'] = pd.to_timedelta(activities_df['Activity - Duration']) # 计算每种活动类型的总工时 total_duration_by_type = activities_df.groupby('Activity - Type')['Activity - Duration'].sum() # 将总工时转换为小时 total_hours_by_type = total_duration_by_type.dt.total_seconds() / 3600 total_hours_by_type
10、最后智能分析的结果如下:
11、进一步根据上文分析的内容快速来生成可视化的图表——条形图、饼图、曲线图等可以根据自己的需求随意切换,相当灵活。
12、还可以让小助手根据分析的结果写一个工作汇报。虽然有些套话,但自己再润色下还是可以给领导汇报的。
尊敬的领导: 根据对活动数据的分析,我们得出了以下结论: 活动类型分布:我们的数据涵盖了多种活动类型,包括内部会议、客户拜访、技术交流等。每种活动类型都有其特定的工时分配。 主要工时消耗:在所有活动类型中,“TC-老客户售后”和“内部会议与培训”占据了最多的工时,分别为520.25小时和247小时。这表明这些活动是公司日常运营中最为重要和耗时的部分。 效率提升空间:某些活动类型如“电话”和“视频会议”所占工时较少,这可能意味着这些活动相对更高效,或者是因为其性质不需要长时间的投入。 时间管理建议:鉴于“TC-老客户售后”和“内部会议与培训”等活动的高工时消耗,建议对这些活动进行进一步的效率分析和优化,以提高整体工作效率。 未来规划:对于工时较少的活动,如“电话”和“视频会议”,可以考虑是否有提升其效率和效果的空间,或者是否有增加这些活动频率的必要,以支持公司的业务发展。 综上所述,通过对活动类型的工时分析,我们不仅能够了解公司资源的分配情况,还能够为未来的工作规划和资源配置提供数据支持。 请您审阅,如有任何问题或需要进一步的分析,请随时告知。 此致, [您的名字] [日期]
同时也可以保存工作汇报到本地和数据管理。
13、如果不知道针对自己上传的文件还能做什么分析,可以参考下小助手的提示或者官方的示例。
三、其他功能
1、历史回溯——查询自己曾经进行的分析会话。
2、数据管理——可以先先把文件/文件夹上传到这里然后进行分析,也可以把分析后的结果保存在这里。
3、人设管理——默认有数据分析工程师,还可以自己创建人设。
4、导入数据库文件——对数据库表做分析
可以分析下这三张表的关系。
进而生成三者的关系图。
可以让小助手做个市场结论。
基于当前的数据和关系图,我们可以得出以下初步的市场结论: 用户购买行为:通过分析特定用户的订单历史,我们可以了解用户的购买偏好、购买频率以及他们更倾向于购买哪些产品。这有助于进行更个性化的市场营销活动。 产品销售情况:通过分析订单数据,我们可以确定哪些产品更受欢迎,哪些产品的销售量较低。这有助于调整库存、促销策略以及新产品的开发。 用户与产品的关系:通过分析哪些用户购买了哪些产品,我们可以了解不同用户群体的购买偏好。这有助于针对不同的用户群体进行更有针对性的市场营销活动。 时间因素:如果考虑订单日期,我们可以分析产品销售的季节性变化,从而更好地规划促销活动和库存管理。 地域因素:考虑到用户的注册地点,我们可以分析不同地区的市场需求,从而进行更有针对性的市场策略。 总之,通过对用户、产品和订单数据的深入分析,我们可以获得宝贵的市场洞察,从而制定更有效的市场策略。
四、使用体验
曾经有很多人热衷学Python来日常办公的数据分析处理,但有了小浣熊出世,数据分析不会Python也能晚的起飞。
小浣熊办公助手操作界面简单直观,即使一点数据分析经验的用户也能轻松上手。支持多种数据来源,包括Excel、CSV、JSON等多种文件类型,方便用户导入数据进行分析。同时可以在分析过程中进行多轮的需求反馈,不断优化自己的分析结果。
支持复杂表格、多表格、多文件的理解,能够完成数据清洗、比较分析、归类分析等常见数据分析任务。能把分析的结果生成各种可视化图表和一键报告,从此给领导汇报不用愁。
更多的宝藏用法还要继续在实际的工作中来挖掘,这么好的工具需要让更多打工人来知晓,让技术来提升办公生产力。