Linux:如何調(diào)試 Malloc 的底層源碼
一、背景
1. 講故事
上一篇我們聊過 C# 調(diào)用 C 的 malloc 代碼來演示heap的內(nèi)存泄露問題,但要想深入研究得必須把 malloc 的實(shí)現(xiàn)庫 libc.so 給調(diào)試起來,大家都知道在Linux 上 libc 和 Windows 的 Win32 API 是一個(gè)層級(jí)的,由于 Linux 重度依賴 libc,比較吐槽的是兩者各自為政,如果手工編譯 libc,容易搞出很多兼容性問題,這一點(diǎn)真的不如 Windows 的大一統(tǒng)來的痛快,手工編譯比較繁瑣,用此篇來記錄下。
二、手工編譯 libc
1. 下載 libc 2.39 源代碼
要想知道下載哪個(gè)版本的 libc,可以用 ldd 觀察現(xiàn)存的 libc 版本,參考如下:
root@ubuntu2404:/data# ldd /bin/bash | grep libc
 libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x0000737556800000)
root@ubuntu2404:/data# /lib/x86_64-linux-gnu/libc.so.6
GNU C Library (Ubuntu GLIBC 2.39-0ubuntu8.4) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
This is free software; see the sourcefor copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
Compiled by GNU CC version 13.3.0.
libc ABIs: UNIQUE IFUNC ABSOLUTE
Minimum supported kernel: 3.2.0
For bug reporting instructions, please see:
<https://bugs.launchpad.net/ubuntu/+source/glibc/+bugs>.從卦象看,當(dāng)前 libc 的版本是 Ubuntu GLIBC 2.39-0ubuntu8.4,接下來下載 2.39 版本的源代碼進(jìn)行編譯即可。
root@ubuntu2404:/src# wget http://ftp.gnu.org/gnu/libc/glibc-2.39.tar.gz
root@ubuntu2404:/src# tar -xzf glibc-2.39.tar.gz && cd glibc-2.39 && mkdir build && cd build
root@ubuntu2404:/src/glibc-2.39/build# ../configure --prefix=/usr --enable-debug=yes
root@ubuntu2404:/src/glibc-2.39/build# make -j$(nproc)
root@ubuntu2404:/src/glibc-2.39/build# ./libc.so --version
GNU C Library (GNU libc) stable release version 2.39.
Copyright (C) 2024 Free Software Foundation, Inc.
...稍等片刻后,就可以看到源碼編譯出來的 libc.so ,截圖如下:

2. 配置 C 代碼
寫了一段簡單的 C 代碼,參考如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
    // getchar();    !!! 先注釋掉的,后續(xù)放開
    void *ptr = malloc(100);
    if (ptr == NULL)
    {
        fprintf(stderr, "malloc failed\n");
        return1;
    }
    free(ptr);
    printf("malloc and free succeeded\n");
    getchar();
    return0;
}
為了能夠加載我的libc庫,使用 `LD_PRELOAD` 環(huán)境變量指定,本想用 gdb 啟動(dòng)調(diào)試的方式執(zhí)行 main,無奈編譯出來的 __vdso_timeDuring 和 kernel 有兼容性問題導(dǎo)致報(bào)錯(cuò),輸出如下:
``` C#
root@ubuntu2404:/data# gdb ./main
Reading symbols from ./main...
(gdb) set environment LD_PRELOAD /src/glibc-2.39/build/libc.so
(gdb) run
Starting program: /data/main 
     58340: __vdso_timeDuring startup program terminated with signal SIGSEGV, Segmentation fault.一定搗鼓之后,我發(fā)現(xiàn)不用 gdb 啟動(dòng)就沒有問題,同時(shí)內(nèi)存段也掛上了我的自定義libc,太棒了,輸出如下:
root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main
mallocandfree succeeded
root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root       58361    1251013:55 pts/0    00:00:00 ./main
root       58366    1869013:56 pts/1    00:00:00 grep --color=auto main
root@ubuntu2404:/src/glibc-2.39/build# cat /proc/58361/maps
60fc4cd29000-60fc4cd2a000 r--p 0000000008:031703942                    /data/main
60fc4cd2a000-60fc4cd2b000 r-xp 0000100008:031703942                    /data/main
60fc4cd2b000-60fc4cd2c000 r--p 0000200008:031703942                    /data/main
60fc4cd2c000-60fc4cd2d000 r--p 0000200008:031703942                    /data/main
60fc4cd2d000-60fc4cd2e000 rw-p 0000300008:031703942                    /data/main
60fc8a96c000-60fc8a98d000 rw-p 0000000000:000                          [heap]
7add43aaa000-7add43aad000 rw-p 0000000000:000
7add43aad000-7add43ad1000 r--p 0000000008:032915675                    /src/glibc-2.39/build/libc.so
7add43ad1000-7add43c21000 r-xp 0002400008:032915675                    /src/glibc-2.39/build/libc.so
7add43c21000-7add43c78000 r--p 0017400008:032915675                    /src/glibc-2.39/build/libc.so
7add43c78000-7add43c7c000 r--p 001ca000 08:032915675                    /src/glibc-2.39/build/libc.so
7add43c7c000-7add43c7e000 rw-p 001ce000 08:032915675                    /src/glibc-2.39/build/libc.so
...這就叫在絕望中尋找希望,既然能運(yùn)行,那就用 gdb 附加調(diào)試吧,只要能研究到 malloc 的底層代碼才是最終目的。。。
把 main() 函數(shù)入口的 getchar() 給注釋掉,方便在 malloc 之前通過 attach 附加,為了能夠在 vscode 中操作,新增一個(gè)對(duì)可執(zhí)行文件可控的 launch.json,內(nèi)容如下:
{
    "configurations": [
        {
            "name": "C/C++: gcc build and debug active file",
            "type": "cppdbg",
            "request": "attach",
            "program": "${fileDirname}/${fileBasenameNoExtension}",
            "processId": "${command:pickProcess}",      // 選擇要附加的進(jìn)程
            "stopAtEntry": false,
            "setupCommands": [
                {
                    "description": "Enable pretty-printing for gdb",
                    "text": "-enable-pretty-printing",
                    "ignoreFailures": true
                },
                {
                    "description": "Set Disassembly Flavor to Intel",
                    "text": "-gdb-set disassembly-flavor intel",
                    "ignoreFailures": true
                }
            ],
        }
    ],
    "version": "2.0.0"
}再新增一個(gè) gcc 編譯的 task 任務(wù)文件 (task.json),內(nèi)容如下:
{
    "tasks": [
        {
            "type": "cppbuild",
            "label": "C/C++: gcc build active file",
            "command": "/usr/bin/gcc",
            "args": [
                "-fdiagnostics-color=always",
                "-g",
                "${file}",
                "-o",
                "${fileDirname}/${fileBasenameNoExtension}"
            ],
            "options": {
                "cwd": "${fileDirname}"
            },
            "problemMatcher": [
                "$gcc"
            ],
            "group": {
                "kind": "build",
                "isDefault": true
            },
            "detail": "Task generated by Debugger."
        }
    ],
    "version": "2.0.0"
}稍微解釋一下:
"processId": "${command:pickProcess}"表示彈框選擇你要附加的進(jìn)程。"request": "attach"使用附加進(jìn)程的模式
在 vscode 中使用 Ctrl+Shift+B 或者 gcc -g main.c -o main 對(duì)代碼進(jìn)行構(gòu)建,接下來執(zhí)行代碼。
root@ubuntu2404:/data# LD_PRELOAD=/src/glibc-2.39/build/libc.so ./main
root@ubuntu2404:/src/glibc-2.39/build# ps -ef | grep main
root       58992    1251  0 14:14 pts/0    00:00:00 ./main
root       58999    1869  0 14:16 pts/1    00:00:00 grep --color=auto main點(diǎn)擊UI中 Run -> Start Debugging 選擇要附加的 pid=58992 ,截圖如下:
圖片
3. 觀察效果
vscode 附加成功后,在 UI 上 Enter 回車過掉 getchar(),單步 F11 調(diào)試即可進(jìn)入 malloc 方法實(shí)現(xiàn),挺有意思的,最后給大家截一張大圖:
圖片
三、總結(jié)
對(duì) Win32 級(jí)別的 libc 進(jìn)行源碼調(diào)試,有助于我們對(duì)書籍中那些malloc的底層理論知識(shí)有一個(gè)很好的眼見為實(shí),也是給Linux上的.NET高級(jí)調(diào)試打開了一扇窗!















 
 
 









 
 
 
 