我正在尝试从数据库中提取一些数据到XML文件中。为此,请使用bash脚本来调用sqlplus命令,并将结果假脱机到新文件中。
一旦提取结果,问题就会发生。我的xml文件不再有效,因为添加了一些不需要的新行...
这是我想要的示例:
<xml>
<element>John</element>
<element>some data</element>
<element>a longer data line</element>
</xml>
这是我得到的:
<xml>
<element>John</element>
<element>some data</eleme
nt>
<element>a longer data
line</element>
</xml>
似乎最长的行被剪掉了,但是我在Sqlplus中将行大小设置为32767,这些行并不那么长...
这是我的sqlplus命令的样子:
sqlplus -s {connection} << EOF
set serveroutput on size unlimited
set feedback off
set termout off
set linesize 32767
spool file.xml;
DECLARE
l_xmltype XMLTYPE;
l_ctx dbms_xmlgen.ctxhandle;
v_clob CLOB;
v_clob_length INTEGER;
pos INTEGER;
buffer VARCHAR2(32767);
amount BINARY_INTEGER := 32767;
BEGIN
l_ctx := dbms_xmlgen.newcontext('SELECT a.rowid, a.* FROM mytable a');
l_xmltype := dbms_xmlgen.getXmlType(l_ctx);
dbms_xmlgen.closeContext(l_ctx);
v_clob := l_xmltype.getClobVal;
v_clob_length := length(v_clob);
WHILE pos < clob_length LOOP
dbms_lob.read(v_clob, amount, pos, buffer);
dbms_output.put_line(buffer);
pos := pos + amount;
END LOOP;
END;
/
EOF
Spool off;
您有什么帮助我解决这个问题的线索吗?
谢谢!
正如@kfinity所建议的,这与CLOB处理有关,但也与dbms_output工作方式有关。您正在以32k的块为单位读取CLOB,并使用来写出每个块put_line(),这会在每个32k块之后追加一个换行符。这些不与XML文档中现有的换行符对齐,因此您可以得到原始的换行符,然后再得到其他的换行符-看起来有些随机和中间文本,但实际上位于可预测的位置。
一个明显的解决方案是从切换put_line()到put(),但这会破坏最大缓冲区大小并抛出类似“ ORU-10028:行长溢出,每行限制为32767字节”的信息。
您可以一次读取一行,而不必读取固定的32k块。CLOB并不真正理解换行符,但是您可以查找换行符,例如:
WHILE pos < v_clob_length LOOP
-- read to next newline if there is one, rest of CLOB if not
if dbms_lob.instr(v_clob, chr(10), pos) > 0 then
amount := dbms_lob.instr(v_clob, chr(10), pos) - pos;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount + 1; -- skip newline character
else
amount := 32767;
dbms_lob.read(v_clob, amount, pos, buffer);
pos := pos + amount;
end if;
dbms_output.put_line(buffer);
END LOOP;
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。