Finger:一款函数符号识别神器

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心 防病毒版,最高20核 3个月
云安全中心 免费版,不限时长
简介: 阿里云·云安全技术实验室正式推出一款二进制函数符号识别引擎--Finger

阿里云·云安全技术实验室正式推出一款二进制函数符号识别引擎--Finger,用户可以通过IDA插件和python SDK两种方式,识别二进制程序中的库函数与常见的第三方函数,快速定位恶意代码,提高样本分析效率。

产品背景

应用程序静态编译后,代码体积膨胀了几十倍,然而真正的用户逻辑代码所占比例很低。下图仅是一个简单的测试程序,静态链接的函数数量约为动态链接函数数量的65倍。这在二进制恶意代码检测领域中十分常见,恶意代码与库代码杂糅在一起,极大地增加了安全研究人员的逆向分析难度,分析过程极为耗时。

#include <stdio.h>

int main(){
   printf("hello world\n");
   return 0;
}

1.png

产品介绍

基于阿里云云安全中心在二进制检测能力建设上多年的经验,以及人工智能在软件安全领域中的实践探索,阿里云·云安全技术实验室立足于阿里云平台的大数据分析能力,将专家知识和人工智能技术结合,提出一套二进制函数签名算法,并将其集成于函数符号识别工具Finger中,免费向用户开放。旨在推动二进制恶意代码检测领域的基础能力建设,促进未知样本发现、漏洞挖掘、二进制文件组成成分分析等研究领域的发展。

2.jpg

使用方式

目前,Finger支持IDA插件和python SDK两种使用方式。

方式一:Python SDK

通过pip安装python SDK:

pip install finger_sdk

提示:安装Finger的python的版本要与IDAPython的版本一致。

使用示例如下:

# IDA Python
# coding: utf-8
import idc
import idaapi
import idautils
from finger_sdk import client, ida_func
import platform

def recognize_functions(client):
    for func_ea in idautils.Functions():
        pfn = idaapi.get_func(func_ea)
        func_name = idaapi.get_func_name(func_ea)
        func_feat = ida_func.get_func_feature(pfn.start_ea)
        if func_feat:
            func_id, res = client.recognize_function(func_feat)
            if res and res[func_id]:
                func_symbol = res[func_id]
                print("[+]Recognize %s: %s" %(func_name, func_symbol))

def main():
    url = "https://sec-lab.aliyun.com/finger/recognize/"
    headers = {'content-type': 'application/json'}
    timeout = 5
    version = platform.python_version()
    if version.startswith('3'):
        ida_auto.auto_wait()
        my_client = client.Client(url, headers, timeout)
        recognize_functions(my_client)
        ida_pro.qexit(0)
    else:
        Wait()
        my_client = client.Client(url, headers, timeout)
        recognize_functions(my_client)
        Exit(0)

if __name__ == "__main__":
    main()

方式二:IDA插件

在方式一的基础上,再将Finger IDA plugin复制到IDA安装目录的plugins目录中。

Finger IDA插件支持单个函数、选中的多个函数和全部函数上传,用户可以在菜单栏、反汇编窗口和函数窗口进行函数符号识别。

菜单栏-Finger

3.png

反汇编窗口-Finger

4.png

函数窗口-Finger

5.png

成功识别的函数符号将在反汇编窗口和函数窗口高亮显示。

海量数据支持

基于阿里云平台的大数据处理和分析能力,我们将阿里云海量样本数据与已知信息的公开二进制文件融合,利用基于专家知识和AI的二进制函数签名算法,从中提取函数签名并将其入库。目前函数签名库中已有亿级的函数签名与函数符号,且每天以百万级的速度自动增长,这使得Finger可以自动迭代成长,降低了人工维护成本,并保证了Finger识别的准确率。Finger目前已支持x86/ARM/MIPS架构的32位/64位的ELF/PE文件的函数符号识别。

识别准确率高

目前,Finger已作为基础组件集成于阿里云云安全中心的多个安全产品中,并在日常工作中辅助团队研究人员在样本分析中快速定位恶意代码。经过数月阿里云平台日均过百万的海量样本数据训练和测试,准确率较高。

示例程序1

下图的二进制程序样本来源于上文产品背景中的测试程序,通过Finger进行函数符号识别,可将glibc中的库函数精准识别出来。

7.png

示例程序2

下图是同属于Skidmap木马家族的两个恶意样本(样本md5分别为
04b75469060b9a2aa986af3c1533c058和4ff73477a06a3412145d1a7e6d9ce4c9),其中04b75469060b9a2aa986af3c1533c058样本静态编译没有符号。

04b75469060b9a2aa986af3c1533c058   无符号
4ff73477a06a3412145d1a7e6d9ce4c9   有符号

使用Finger对无符号的04b75469060b9a2aa986af3c1533c058进行函数符号识别,Finger成功恢复出了程序的主体逻辑:

8.png

将Finger的识别结果与有符号的4ff73477a06a3412145d1a7e6d9ce4c9进行对比,可以看到Finger的函数符号识别准确率较高。利用Finger的函数符号识别能力,可以帮助安全研究人员快速地对未知样本进行分类打标。

9.png

示例程序3

下图是一个sshd基础软件污染样本(md5为eab14398a66bb088d0cfab4f7737c58d),使用Finger识别函数符号后,安全研究人员可以快速筛选出用户逻辑代码,从而定位恶意代码。

10.png

团队介绍

阿里云·云安全技术实验室 --- 长期从事病毒检测,立体化防御,漏洞挖掘,安全底层技术研究等,保障海量阿里云业务安全。

欢迎各位安全爱好者加入交流
钉钉群号:34132850,群二维码如下:

相关文章
|
8月前
|
数据库
小课堂 -- 绕过去除注释符(Get)
小课堂 -- 绕过去除注释符(Get)
42 0
|
4月前
|
API Windows
用MASM32来DIY判断字符串1是否为字符串2的子串的函数演示代码(源码+exe)(应用lstrcpyn()和lstrcmp(),区分大小写)
用MASM32来DIY判断字符串1是否为字符串2的子串的函数演示代码(源码+exe)(应用lstrcpyn()和lstrcmp(),区分大小写)
用MASM32编程截取屏幕
用MASM32编程截取屏幕
|
7月前
|
Linux C语言
探索Linux命令c2ph:将C代码转换为PostScript或PDF的奇妙工具
`c2ph`是Linux下的工具,能将C代码转换为PostScript或PDF,便于阅读和分享。通过pretty-print技术美化源代码。安装需从源码编译,使用`c2ph -o &lt;output&gt; &lt;source.c&gt;`生成PostScript文件,再用`ps2pdf`转为PDF。注意它可能不支持复杂格式设置,大型文件处理可能慢,且兼容性有限。适合偶尔需要打印代码副本的情况。
|
JavaScript 前端开发
js正则表达式的作用及使用方法
js正则表达式的作用及使用方法
111 1
|
8月前
|
机器学习/深度学习 弹性计算 运维
判断用户输入的是Yes 或NO
【4月更文挑战第29天】
53 0
|
编译器 开发工具 Windows
VS2008 未找到编译器可执行文件 csc.exe【当网上其他方法试玩了之后不起作用的时候再用这个方法】
被公司派遣到中国海洋石油惠州炼化公司做项目,做的是生产管理,来了发现他们的项目结构简直烂的要命,和同学们写的毕业设计差不多,然后开发工具用的是vs2008,我电脑是安装了vs2005和vs2010,vs2012就是没有安装vs2008,在安装vs2008的时候那是一番折腾好长时间,然后把vs2008安装好了打开项目代码,生成解决方案发现报了好多错,然后一一解决,最奇怪的是VS2008 未找到编译器可执行文件 csc.exe,我把所以路径都配好了,并且在dos环境下执行csc.exe都可以执行,环境变量路径设置的也么有问题,就是很奇怪重启机子打开项目还是找不到csc.exe
199 0
|
Python
Python 自写函数内容实现大小写转换(含详细注释解析)
Python 自写函数内容实现大小写转换(含详细注释解析)
426 0
|
存储 Shell
shell脚本编程之处理用户输入(一)
shell脚本编程之处理用户输入(一)
535 0
|
Shell Linux 数据安全/隐私保护
shell脚本编程之处理用户输入(二)
shell脚本编程之处理用户输入(二)
166 0