space-t 使用到的tokenizer是否对英文不区分大小写,我们尝试了一下对大写条件的查询,比如查询名称为'A'的基金,但是在sql结果里回将其转换为查询名称'a'的基金,这样就无法通过sql执行器找到对应的结果。请问如何来区分大小写?谢谢
您好,由于这个模型是基于BERT框架的,而BERT的词表并没有办法支持大小写,因为他会把所有的大写字母转换成小写然后输给模型。 解决办法可以如下: 1. 将表格中的每个单元格进行小写处理然后保存; 2. 对模型预测的结果查询小写处理后的表格; 3. 获得的结果再反向查找原始表格;