调试信息迁移:从内联函数到记录

我们计划从 LLVM 中移除调试信息内联函数,因为它们速度慢、笨拙,并且如果优化 pass 没有预期到它们,可能会造成混淆。与其拥有一系列如下所示的指令

    %add = add i32 %foo, %bar
    call void @llvm.dbg.value(metadata %add, ...
    %sub = sub i32 %add, %tosub
    call void @llvm.dbg.value(metadata %sub, ...
    call void @a_normal_function()

其中 dbg.value 内联函数表示调试信息记录,它将被打印为

    %add = add i32 %foo, %bar
      #dbg_value(%add, ...
    %sub = sub i32 %add, %tosub
      #dbg_value(%sub, ...
    call void @a_normal_function()

调试记录不是指令,不会出现在指令列表中,也不会出现在您的优化 pass 中,除非您刻意去挖掘它们。

太好了,我需要做什么呢!

我们已经基本完成了迁移。剩下的一个粗糙之处是,向前看,指令必须使用迭代器而不是指令指针插入到基本块中。在几乎所有情况下,您只需在指令指针上调用 getIterator – 但是,如果您调用一个返回基本块开始的函数,例如

  1. BasicBlock::begin

  2. BasicBlock::getFirstNonPHIIt

  3. BasicBlock::getFirstInsertionPt

那么您必须将该迭代器传递到插入函数中,而无需修改(迭代器携带调试信息位)。就是这样!请继续阅读以获得更详细的解释。

API 变更

有两个重要的变更需要注意。首先,我们正在向 BasicBlock::iterator 类添加一个与调试相关的单个数据位(这是为了我们可以确定范围是否打算在块的开头包含调试信息)。这意味着在编写插入 LLVM IR 指令的 pass 时,您需要使用 BasicBlock::iterator 而不是仅仅使用裸指针 Instruction * 来标识位置。大多数时候,这意味着在确定您打算插入内容的位置后,您还必须在指令位置上调用 getIterator – 但是,当在块的开头插入时,您必须使用 getFirstInsertionPtgetFirstNonPHIItbegin 并使用该迭代器进行插入,而不是仅仅获取指向第一条指令的指针。

第二件事是,如果您手动将指令序列从一个地方传输到另一个地方,即重复使用 moveBefore,而您可能已经使用了 splice,那么您应该改为使用方法 moveBeforePreservingmoveBeforePreserving 将随指令一起传输调试信息记录。这是今天自动发生的事情 – 如果您在指令序列的每个元素上使用 moveBefore,那么调试内联函数将在您的代码的正常过程中移动,但是对于非指令调试信息,我们会丢失此行为。

有关如何更新现有代码以支持调试记录的更深入概述,请参阅下面的指南

文本 IR 变更

随着我们从使用调试内联函数更改为使用调试记录,任何依赖于解析 LLVM 生成的 IR 的工具都需要处理新格式。在大多数情况下,调试内联函数调用和调试记录的打印形式之间的差异是微不足道的

  1. 增加了额外的 2 个空格的缩进。

  2. 文本 (tail|notail|musttail)? call void @llvm.dbg.<type> 被替换为 #dbg_<type>

  3. 前导 metadata 从内联函数的每个参数中删除。

  4. DILocation 从格式为 !dbg !<Num> 的指令附件更改为普通参数,即 !<Num>,作为最后一个参数传递给调试记录。

遵循这些规则,我们有这个调试内联函数和等效调试记录的示例

; Debug Intrinsic:
  call void @llvm.dbg.value(metadata i32 %add, metadata !10, metadata !DIExpression()), !dbg !20
; Debug Record:
    #dbg_value(i32 %add, !10, !DIExpression(), !20)

测试更新

由于更改为使用记录,主 LLVM 仓库下游的任何测试 LLVM 的 IR 输出的测试都可能会中断。考虑到上述更新规则,更新单个测试以期望记录而不是内联函数应该是很简单的。但是,更新许多测试可能会很麻烦;为了更新主仓库中的 lit 测试,使用了以下步骤

  1. 将失败的 lit 测试列表收集到一个名为 failing-tests.txt 的文件中,并用换行符分隔(并以换行符结尾)。

  2. 使用以下行将失败的测试拆分为使用 update_test_checks 的测试和不使用的测试

    $ while IFS= read -r f; do grep -q "Assertions have been autogenerated by" "$f" && echo "$f" >> update-checks-tests.txt || echo "$f" >> manual-tests.txt; done < failing-tests.txt
    
  3. 对于使用 update_test_checks 的测试,运行相应的 update_test_checks 脚本 - 对于主 LLVM 仓库,这是通过以下方式实现的

    $ xargs ./llvm/utils/update_test_checks.py --opt-binary ./build/bin/opt < update-checks-tests.txt
    $ xargs ./llvm/utils/update_cc_test_checks.py --llvm-bin ./build/bin/ < update-checks-tests.txt
    
  4. 剩余的测试可以手动更新,但是,如果测试数量很大,则以下脚本可能很有用;首先,是一个用于从文件中提取 check-line 前缀的脚本

    $ cat ./get-checks.sh
    #!/bin/bash
    
    # Always add CHECK, since it's more effort than it's worth to filter files where
    # every RUN line uses other check prefixes.
    # Then detect every instance of "check-prefix(es)=..." and add the
    # comma-separated arguments as extra checks.
    for filename in "$@"
    do
        echo "$filename,CHECK"
        allchecks=$(grep -Eo 'check-prefix(es)?[ =][A-Z0-9_,-]+' $filename | sed -E 's/.+[= ]([A-Z0-9_,-]+).*/\1/g; s/,/\n/g')
        for check in $allchecks; do
            echo "$filename,$check"
        done
    done
    

    然后是第二个脚本,用于执行实际更新每个失败测试中的 check-line 的工作,使用一系列简单的替换模式

    $ cat ./substitute-checks.sh
    #!/bin/bash
    
    file="$1"
    check="$2"
    
    # Any test that explicitly tests debug intrinsic output is not suitable to
    # update by this script.
    if grep -q "write-experimental-debuginfo=false" "$file"; then
        exit 0
    fi
    
    sed -i -E -e "
    /(#|;|\/\/).*$check[A-Z0-9_\-]*:/!b
    /DIGlobalVariableExpression/b
    /!llvm.dbg./bpostcall
    s/((((((no|must)?tail )?call.*)?void )?@)?llvm.)?dbg\.([a-z]+)/#dbg_\7/
    :postcall
    /declare #dbg_/d
    s/metadata //g
    s/metadata\{/{/g
    s/DIExpression\(([^)]*)\)\)(,( !dbg)?)?/DIExpression(\1),/
    /#dbg_/!b
    s/((\))?(,) )?!dbg (![0-9]+)/\3\4\2/
    s/((\))?(, ))?!dbg/\3/
    " "$file"
    

    这两个脚本组合起来可以在 manual-tests.txt 中的列表上使用,如下所示

    $ cat manual-tests.txt | xargs ./get-checks.sh | sort | uniq | awk -F ',' '{ system("./substitute-checks.sh " $1 " " $2) }'
    

    这些脚本成功地处理了 clang/testllvm/test 中的绝大多数检查。

  5. 验证生成的测试是否通过,并检测任何失败的测试

    $ xargs ./build/bin/llvm-lit -q < failing-tests.txt
    ********************
    Failed Tests (5):
    LLVM :: DebugInfo/Generic/dbg-value-lower-linenos.ll
    LLVM :: Transforms/HotColdSplit/transfer-debug-info.ll
    LLVM :: Transforms/ObjCARC/basic.ll
    LLVM :: Transforms/ObjCARC/ensure-that-exception-unwind-path-is-visited.ll
    LLVM :: Transforms/SafeStack/X86/debug-loc2.ll
    
    
    Total Discovered Tests: 295
    Failed: 5 (1.69%)
    
  6. 某些测试可能已失败 - 更新脚本过于简单,并且不跨行保留上下文,因此在某些情况下它们将无法处理;剩余的情况必须手动更新(或由其他脚本处理)。

C-API 变更

已经添加的一些新函数是临时的,将来会被弃用。目的是帮助下游项目在过渡期间进行调整。

Deleted functions
-----------------
LLVMDIBuilderInsertDeclareBefore   # Insert a debug record (new debug info format) instead of a debug intrinsic (old debug info format).
LLVMDIBuilderInsertDeclareAtEnd    # Same as above.
LLVMDIBuilderInsertDbgValueBefore  # Same as above.
LLVMDIBuilderInsertDbgValueAtEnd   # Same as above.

New functions (to be deprecated)
--------------------------------
LLVMIsNewDbgInfoFormat     # Returns true if the module is in the new non-instruction mode.
LLVMSetIsNewDbgInfoFormat  # Convert to the requested debug info format.

New functions (no plans to deprecate)
-------------------------------------
LLVMGetFirstDbgRecord                    # Obtain the first debug record attached to an instruction.
LLVMGetLastDbgRecord                     # Obtain the last debug record attached to an instruction.
LLVMGetNextDbgRecord                     # Get next debug record or NULL.
LLVMGetPreviousDbgRecord                 # Get previous debug record or NULL.
LLVMDIBuilderInsertDeclareRecordBefore   # Insert a debug record (new debug info format).
LLVMDIBuilderInsertDeclareRecordAtEnd    # Same as above. See info below.
LLVMDIBuilderInsertDbgValueRecordBefore  # Same as above. See info below.
LLVMDIBuilderInsertDbgValueRecordAtEnd   # Same as above. See info below.

LLVMPositionBuilderBeforeDbgRecords          # See info below.
LLVMPositionBuilderBeforeInstrAndDbgRecords  # See info below.

LLVMDIBuilderInsertDeclareRecordBeforeLLVMDIBuilderInsertDeclareRecordAtEndLLVMDIBuilderInsertDbgValueRecordBeforeLLVMDIBuilderInsertDbgValueRecordAtEnd 正在替换已删除的 LLVMDIBuilderInsertDeclareBefore-style 函数。

LLVMPositionBuilderBeforeDbgRecordsLLVMPositionBuilderBeforeInstrAndDbgRecords 的行为与 LLVMPositionBuilderLLVMPositionBuilderBefore 相同,不同之处在于插入位置设置在目标指令之前的调试记录之前。请注意,这并不意味着会跳过所选指令之前的调试内联函数,而只会跳过调试记录(与调试记录不同,调试记录本身不是指令)。

如果您不知道要调用哪个函数,请遵循以下规则:如果您尝试在块的开头插入,或者出于任何其他原因有目的地跳过调试内联函数以确定插入点,请调用新函数。

LLVMPositionBuilderLLVMPositionBuilderBefore 没有变化。它们在指示的指令之前插入,但在任何附加的调试记录之后插入。

LLVMGetFirstDbgRecordLLVMGetLastDbgRecordLLVMGetNextDbgRecordLLVMGetPreviousDbgRecord 可用于迭代附加到指令的调试记录(以 LLVMValueRef 形式提供)。

LLVMDbgRecordRef DbgRec;
for (DbgRec = LLVMGetFirstDbgRecord(Inst); DbgRec;
     DbgRec = LLVMGetNextDbgRecord(DbgRec)) {
  // do something with DbgRec
}
LLVMDbgRecordRef DbgRec;
for (DbgRec = LLVMGetLastDbgRecord(Inst); DbgRec;
     DbgRec = LLVMGetPreviousDbgRecord(DbgRec)) {
  // do something with DbgRec
}

新的“调试记录”模型

以下是替换调试内联函数的新表示形式的简要概述;有关更新旧代码的指导性指南,请参阅此处

您究竟用什么替换了调试内联函数?

我们正在使用一个专用的 C++ 类 DbgRecord 来存储调试信息,在任何 LLVM IR 程序中,调试内联函数的每个实例和每个 DbgRecord 对象之间都存在一对一的关系;这些 DbgRecord 在 IR 中表示为非指令调试记录,如 Source Level Debugging 文档中所述。这个类有一组子类,它们存储的信息与调试内联函数中存储的信息完全相同。每个子类也几乎具有完全相同的方法集,这些方法的行为方式相同

https://llvm.net.cn/docs/doxygen/classllvm_1_1DbgRecord.html https://llvm.net.cn/docs/doxygen/classllvm_1_1DbgVariableRecord.html https://llvm.net.cn/docs/doxygen/classllvm_1_1DbgLabelRecord.html

这允许您将 DbgVariableRecord 视为 dbg.value/dbg.declare/dbg.assign 内联函数,大多数时候都是如此,例如在泛型(自动参数)lambda 中,对于 DbgLabelRecorddbg.label 也是如此。

这些 DbgRecord 如何融入指令流?

像这样

                 +---------------+          +---------------+
---------------->|  Instruction  +--------->|  Instruction  |
                 +-------+-------+          +---------------+
                         |
                         |
                         |
                         |
                         v
                  +-------------+
          <-------+  DbgMarker  |<-------
         /        +-------------+        \
        /                                 \
       /                                   \
      v                                     ^
 +-------------+    +-------------+   +-------------+
 |  DbgRecord  +--->|  DbgRecord  +-->|  DbgRecord  |
 +-------------+    +-------------+   +-------------+

每个指令都有一个指向 DbgMarker 的指针(这将变为可选),其中包含 DbgRecord 对象列表。指令列表中根本不显示任何调试记录。 DbgRecord 具有指向其拥有的 DbgMarker 的父指针,并且每个 DbgMarker 都有一个指向其拥有的指令的指针。

未显示的是从 DbgRecord 到 Value/Metadata 层次结构其他部分的链接:DbgRecord 子类具有指向它们使用的 DIMetadata 的跟踪指针,并且 DbgVariableRecord 引用存储在 DebugValueUser 基类中的 Value。这指的是通过 TrackingMetadata 工具引用 ValueValueAsMetadata 对象。

各种类型的调试内联函数(value、declare、assign、label)都存储在 DbgRecord 子类中,其中“RecordKind”字段区分 DbgLabelRecordDbgVariableRecord,而 DbgVariableRecord 类中的 LocationType 字段进一步区分它可以表示的各种调试变量内联函数。

如何更新现有代码

任何以某种方式与调试内联函数交互的现有代码都需要更新为以相同方式与调试记录交互。更新代码时需要记住的几个快速规则

  • 在迭代指令时看不到调试记录;要查找紧接在指令之前出现的调试记录,您需要迭代 Instruction::getDbgRecordRange()

  • 调试记录具有与调试内联函数相同的接口,这意味着任何对调试内联函数进行操作的代码也可以轻松地应用于调试记录。此处的例外是 InstructionCallInst 方法,它们在逻辑上不适用于调试记录,以及 isa/cast/dyn_cast 方法,这些方法已替换为 DbgRecord 类本身的方法。

  • 调试记录不能出现在也包含调试内联函数的模块中;两者是互斥的。由于调试记录是未来的格式,因此在新代码中应优先考虑正确处理记录。

  • 在不再支持内联函数之前,对于仅处理调试内联函数且难以更新的代码,一个有效的热修复方法是使用 Module::setIsNewDbgInfoFormat 将模块转换为内联函数格式,然后再转换回来。

    • 这也可以在模块或单个函数的词法作用域内使用类 ScopedDbgInfoFormatSetter 执行。

    void handleModule(Module &M) {
      {
        ScopedDbgInfoFormatSetter FormatSetter(M, false);
        handleModuleWithDebugIntrinsics(M);
      }
      // Module returns to previous debug info format after exiting the above block.
    }
    

以下是关于如何更新当前支持调试内联函数的现有代码以支持调试记录的粗略指南。

创建调试记录

启用新格式后,DIBuilder 类将自动创建调试记录。与指令一样,也可以调用 DbgRecord::clone 来创建现有记录的未附加副本。

跳过调试记录、忽略 Values 的调试用途、稳定计数指令等

这将全部透明地发生,无需考虑!

for (Instruction &I : BB) {
  // Old: Skips debug intrinsics
  if (isa<DbgInfoIntrinsic>(&I))
    continue;
  // New: No extra code needed, debug records are skipped by default.
  ...
}

查找调试记录

诸如 findDbgUsers 之类的实用程序现在具有一个可选参数,该参数将返回引用 ValueDbgVariableRecord 记录集。您应该能够像对待内联函数一样对待它们。

// Old:
  SmallVector<DbgVariableIntrinsic *> DbgUsers;
  findDbgUsers(DbgUsers, V);
  for (auto *DVI : DbgUsers) {
    if (DVI->getParent() != BB)
      DVI->replaceVariableLocationOp(V, New);
  }
// New:
  SmallVector<DbgVariableIntrinsic *> DbgUsers;
  SmallVector<DbgVariableRecord *> DVRUsers;
  findDbgUsers(DbgUsers, V, &DVRUsers);
  for (auto *DVI : DbgUsers)
    if (DVI->getParent() != BB)
      DVI->replaceVariableLocationOp(V, New);
  for (auto *DVR : DVRUsers)
    if (DVR->getParent() != BB)
      DVR->replaceVariableLocationOp(V, New);

检查位置处的调试记录

调用 Instruction::getDbgRecordRange() 以获取附加到指令的 DbgRecord 对象范围。

for (Instruction &I : BB) {
  // Old: Uses a data member of a debug intrinsic, and then skips to the next
  // instruction.
  if (DbgInfoIntrinsic *DII = dyn_cast<DbgInfoIntrinsic>(&I)) {
    recordDebugLocation(DII->getDebugLoc());
    continue;
  }
  // New: Iterates over the debug records that appear before `I`, and treats
  // them identically to the intrinsic block above.
  // NB: This should always appear at the top of the for-loop, so that we
  // process the debug records preceding `I` before `I` itself.
  for (DbgRecord &DR = I.getDbgRecordRange()) {
    recordDebugLocation(DR.getDebugLoc());
  }
  processInstruction(I);
}

这也可以通过函数 filterDbgVars 传递,以专门迭代更常用的 DbgVariableRecords。

for (Instruction &I : BB) {
  // Old: If `I` is a DbgVariableIntrinsic we record the variable, and apply
  // extra logic if it is an `llvm.dbg.declare`.
  if (DbgVariableIntrinsic *DVI = dyn_cast<DbgVariableIntrinsic>(&I)) {
    recordVariable(DVI->getVariable());
    if (DbgDeclareInst *DDI = dyn_cast<DbgDeclareInst>(DVI))
      recordDeclareAddress(DDI->getAddress());
    continue;
  }
  // New: `filterDbgVars` is used to iterate over only DbgVariableRecords.
  for (DbgVariableRecord &DVR = filterDbgVars(I.getDbgRecordRange())) {
    recordVariable(DVR.getVariable());
    // Debug variable records are not cast to subclasses; simply call the
    // appropriate `isDbgX()` check, and use the methods as normal.
    if (DVR.isDbgDeclare())
      recordDeclareAddress(DVR.getAddress());
  }
  // ...
}

处理单个调试记录

在大多数情况下,任何对调试内联函数进行操作的代码都可以提取到模板函数或自动 lambda(如果尚未在其中),它可以应用于调试内联函数和调试记录 - 但请记住,主要的例外是 isa/cast/dyn_cast 不适用于 DbgVariableRecord 类型。

// Old: Function that operates on debug variable intrinsics in a BasicBlock, and
// collects llvm.dbg.declares.
void processDbgInfoInBlock(BasicBlock &BB,
                           SmallVectorImpl<DbgDeclareInst*> &DeclareIntrinsics) {
  for (Instruction &I : BB) {
    if (DbgVariableIntrinsic *DVI = dyn_cast<DbgVariableIntrinsic>(&I)) {
      processVariableValue(DebugVariable(DVI), DVI->getValue());
      if (DbgDeclareInst *DDI = dyn_cast<DbgDeclareInst>(DVI))
        Declares.push_back(DDI);
      else if (!isa<Constant>(DVI->getValue()))
        DVI->setKillLocation();
    }
  }
}

// New: Template function is used to deduplicate handling of intrinsics and
// records.
// An overloaded function is also used to handle isa/cast/dyn_cast operations
// for intrinsics and records, since those functions cannot be directly applied
// to DbgRecords.
DbgDeclareInst *DynCastToDeclare(DbgVariableIntrinsic *DVI) {
  return dyn_cast<DbgDeclareInst>(DVI);
}
DbgVariableRecord *DynCastToDeclare(DbgVariableRecord *DVR) {
  return DVR->isDbgDeclare() ? DVR : nullptr;
}

template<typename DbgVarTy, DbgDeclTy>
void processDbgVariable(DbgVarTy *DbgVar,
                       SmallVectorImpl<DbgDeclTy*> &Declares) {
    processVariableValue(DebugVariable(DbgVar), DbgVar->getValue());
    if (DbgDeclTy *DbgDeclare = DynCastToDeclare(DbgVar))
      Declares.push_back(DbgDeclare);
    else if (!isa<Constant>(DbgVar->getValue()))
      DbgVar->setKillLocation();
};

void processDbgInfoInBlock(BasicBlock &BB,
                           SmallVectorImpl<DbgDeclareInst*> &DeclareIntrinsics,
                           SmallVectorImpl<DbgVariableRecord*> &DeclareRecords) {
  for (Instruction &I : BB) {
    if (DbgVariableIntrinsic *DVI = dyn_cast<DbgVariableIntrinsic>(&I))
      processDbgVariable(DVI, DeclareIntrinsics);
    for (DbgVariableRecord *DVR : filterDbgVars(I.getDbgRecordRange()))
      processDbgVariable(DVR, DeclareRecords);
  }
}

移动和删除调试记录

您可以使用 DbgRecord::removeFromParent 从其标记中取消链接 DbgRecord,然后使用 BasicBlock::insertDbgRecordBeforeBasicBlock::insertDbgRecordAfterDbgRecord 重新插入到其他位置。您不能将 DbgRecord 插入到 DbgRecord 列表中的任意位置(如果您使用 llvm.dbg.value 执行此操作,则不太可能是正确的)。

通过调用 eraseFromParent 擦除 DbgRecord

// Old: Move a debug intrinsic to the start of the block, and delete all other intrinsics for the same variable in the block.
void moveDbgIntrinsicToStart(DbgVariableIntrinsic *DVI) {
  BasicBlock *ParentBB = DVI->getParent();
  DVI->removeFromParent();
  for (Instruction &I : ParentBB) {
    if (auto *BlockDVI = dyn_cast<DbgVariableIntrinsic>(&I))
      if (BlockDVI->getVariable() == DVI->getVariable())
        BlockDVI->eraseFromParent();
  }
  DVI->insertBefore(ParentBB->getFirstInsertionPt());
}

// New: Perform the same operation, but for a debug record.
void moveDbgRecordToStart(DbgVariableRecord *DVR) {
  BasicBlock *ParentBB = DVR->getParent();
  DVR->removeFromParent();
  for (Instruction &I : ParentBB) {
    for (auto &BlockDVR : filterDbgVars(I.getDbgRecordRange()))
      if (BlockDVR->getVariable() == DVR->getVariable())
        BlockDVR->eraseFromParent();
  }
  DVR->insertBefore(ParentBB->getFirstInsertionPt());
}

悬空调试记录呢?

如果您有这样一个块

    foo:
      %bar = add i32 %baz...
      dbg.value(metadata i32 %bar,...
      br label %xyzzy

您的优化 pass 可能希望擦除终止符,然后对块执行某些操作。当调试信息保留在指令中时,这很容易做到,但是对于 DbgRecord,一旦擦除终止符,就没有尾随指令可以将变量信息附加到上面的块中。对于此类退化块,DbgRecord 暂时存储在 LLVMContext 的映射中,并在将终止符重新插入到块中或在 end() 处插入其他指令时重新插入。

从技术上讲,这可能会在极少数情况下导致问题,即优化 pass 擦除终止符,然后决定擦除整个块。(我们建议不要这样做)。

还有什么吗?

上述指南并未全面涵盖可能适用于调试内联函数的每种模式;正如指南开头所提到的,您可以暂时将目标模块从调试记录转换为内联函数作为权宜之计。大多数可以对调试内联函数执行的操作都具有调试记录的完全等效项,但是如果您遇到任何异常,阅读类文档(此处链接)可能会提供一些见解,现有代码库中可能有一些示例,并且您始终可以在论坛上寻求帮助。