IronRuby - 文件编码惹的祸

简介:

使用VS2010的CodedUI来做自己的自动化测试框架中介绍了我将使用IronRuby作为脚本语言来编写自动化测试脚本,但是当时在使用IronRuby编写脚本过程中发现了一个编码导致的问题,在这里给大家介绍一下,大家在编写脚本时一定要主要脚本文件的编码。

问题描述

  我在rb文件中调用了C#的Microsoft.VisualStudio.TestTools.UITesting.dll的查找按钮并单击的功能,但是总是报错,说找不到此控件,但是我在C#代码中编写类似代码是没有问题。出现问题后上网搜索了一下,但是毕竟资源不多,没有任何结果,于是上IronRuby的codeplex网站提交了一个bug,见:encode error? 具体描述如下

 


   
   
I want to use VisualStudio UITest to do my auto UI test, but I don ' t find window and button.
( attachment is Microsoft.VisualStudio.TestTools.UI
Testing.dll )
code:
require
" Microsoft.VisualStudio.TestTools.UITesting.dll "
include Microsoft::VisualStudio::TestTools::UITesting::WpfControls
w
= WpfWindow. new
w.SearchProperties[
" Name " ] = " 你好 " ;
puts w.SearchProperties[
" Name " ]


result: 脛茫潞脙
expect : 你好
  • 为了简化应用,我在C#中建立了一个Application.cs文件,里面有一个Application类,类中有一个test方法,传入一个string参数并直接返回:

 

    public class Application
    {
        public string test(string a)
        {
            return a;
        }
}

  • 使用Notepad++建立main.rb,里面主要就是调用Application.Test方法:puts Application.new.test("你好")

运行后,显示的不是”你好“两个字,而是几个乱码。

分析问题

  我上网搜了一些和字符编码相关的内容,很多都是介绍字符编码转换的,如result = Iconv.iconv("GB2312","UTF-16",a) ,我在rb脚本和C#都试过了多个字符转换的情况,发现仍旧不能正确解析。

  这时我突然想起上周遇到此问题后我给公司的一个Ruby高手请教过的这个问题,以下是邮件主要内容:

  • 标题:Ruby处理Unicode有没有什么问题?
  • 问:我现在用的是.Net下的一个Ruby实现IronRuby,现在遇到一个问题,不知道Ruby中是否也有,问题是:在ironRuby代码中直接hash.new 附上中文没有问题,但是有种情况有问题,有一个.Net类库,它有个类似hash的属性,我在ironRuby代码中给它付了一个中文,但是取出来的时候发现是乱码了,不知是何原因?
  • 回复:ruby1.8里面是没有编码的概念,都是字符序列.所以你给他什么就是什么,他不关心.但是ruby文件有编码,直接决定了你的字符序列的编码.我不知道.net是什么编码的,两边一致应该就可以了.

我提出了一个假设,是不是文件编码导致的?

解决问题

既然提出了假设,接下来就是验证我的假设了。由于我对字符编码不熟悉,于是又上网搜索了一些,了解了以下Utf-8,GB2312等,而C#是支持Unicode的,所以我接着又试了以下几步:

  • 在Notepad++把文件更改为UTF-8的格式,如下图所示:

 







  • 在ir.exe执行中加入参数 -KU
    ir -KU -X:ShowClrExceptions main.rb

再次运行后,发现竟然一切又是那么美好!

问题回顾

  这个问题前后花了我一天时间去解决,总的来说问题相对来说不难,但是需要对Ruby的字符编码有所了解,而我以前没有注意到这个也会引起问题,从解决这个bug过程中,可以有以下几点与大家分享一下:

  1. 遇到陌生问题而自己没有思路时,求助高手是最快速便捷的方法
  2. 解决问题方法之一就是提出假设再验证假设
  3. 使用新技术时,最好系统学习一下,例如我就是花了半天时间看了一下《IronRuby Unleashed.pdf》一书才知道ir.exe的 参数-KKcode了,否则我更改了文件编码也未必会想到增加ir.exe的参数
  4. 知识点:文件编码直接影响ruby的字符编码





 本文转自 jingen_zhou 51CTO博客,原文链接:http://blog.51cto.com/zhoujg/518033,如需转载请自行联系原作者

相关文章
|
2月前
|
Windows
又是流氓软件/插件惹的祸
又是流氓软件/插件惹的祸
|
2月前
|
安全 Windows
AdWare.HBang.e惹的祸、文件temp1.plt的一点分析(第1版)
AdWare.HBang.e惹的祸、文件temp1.plt的一点分析(第1版)
|
数据采集 搜索推荐 大数据
都是爬虫惹的祸
1、什么是爬虫? 不知道有多少人看过吴军博士的《数学之美》(第二版),如果没有看过,真心推荐你去看看。书中有很大一部分内容在讲搜索引擎和自然语言处理,那这和爬虫有什么关系呢? 其实还是有关系的,做个不恰当的比喻,其实搜索引擎也是一个大型的爬虫,只不过搜索引擎爬的是全网的“公开信息”,然后将网页的内容缓存并建立索引,以便用户进行搜索。
2959 0