使用boost::spirit实现的CSV文件解析类

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介:
boost::spirit真是不错的说。。。。

#include <iostream>
#include <iterator>
#include <vector>
#include < string>

#include <boost/spirit/core.hpp>
#include <boost/spirit/iterator/file_iterator.hpp>

using  namespace std;
using  namespace boost::spirit;

template<typename IteratorT>
struct LineInfo 
{
    IteratorT lineIter;
    size_t lineNum;

    LineInfo( IteratorT beg ) : lineIter(beg), lineNum(1) { }
}
;

template<typename IteratorT>
struct NewLine
{
    LineInfo<IteratorT>& lineInfo;
    NewLine( LineInfo<IteratorT>& info ) : lineInfo(info) { }

    void operator()(IteratorT first, IteratorT last) const
    {
        lineInfo.lineIter = last;
        lineInfo.lineNum++;
    }

}
;

struct AddVal
{
    vector<string>& values;
    AddVal( vector<string>& vec ) : values(vec) { }

    template<class IteratorT>
    void operator()(IteratorT first, IteratorT last) const
    {
#ifdef _MSC_VER
        string s;
        s.resize(distance(first, last));
        for (size_t i = 0; first != last; ++i) 
        {
            s[i] = *first++;
        }

#else
        string s( first, last );
#endif
        string::size_type pos = 0;
        while (1)
        {
            pos = s.find("\"\"", pos);
            if (pos == string::npos)
                break;
            ++pos;
            s.erase(pos, 1);
        }

        values.push_back(s);
    }

}
;

template< class IteratorT>
struct CSVParser :  public grammar<CSVParser<IteratorT> >
{
    vector<string>& v;
    LineInfo<IteratorT>& lineInfo;

    CSVParser( vector<string>& vec, LineInfo<IteratorT>& info ) : v(vec), lineInfo(info) { }

    template <typename ScannerT>
    struct definition 
    {
        rule<ScannerT> csv, val, quoted_val, naked_val;

        definition(const CSVParser<IteratorT>& self)
        {
            csv = val >> *(',' >> val) >>
                (eol_p[NewLine<IteratorT>(self.lineInfo)] | end_p);

            val = *blank_p >>
                ch_p('\"') >> quoted_val[AddVal(self.v)] >> ch_p('\"') >>
                *blank_p
                | naked_val[AddVal(self.v)];

            quoted_val = *(eol_p[NewLine<IteratorT>(self.lineInfo)]
            | ~ch_p('"') | str_p("\"\""));

            naked_val = *(~ch_p(',') & ~ch_p('\"') & ~ch_p('\n'));
        }


        const rule<ScannerT>& start() const return csv; }
    }
;
}
;

template<typename IteratorT>
parse_info<IteratorT>
parse_csv(  const IteratorT& first,  const IteratorT& last,
          vector< string>& vec, LineInfo<IteratorT>& info )
{
    CSVParser<IteratorT> csv(vec, info);

    return parse(first, last, csv);
}


int main(  int argc,  char** argv)
{
    if (argc != 2) return 1;

    typedef file_iterator<char> iterator_t;

    iterator_t begin(argv[1]);
    if (!begin)
    {
        cout << "Unable to open file: " << argv[1] << endl;
        return -1;
    }


    iterator_t first = begin;

    iterator_t last = first.make_end();

    LineInfo<iterator_t> line_info( begin );
    while ( first != last )
    {
        vector<string> v;
        parse_info<iterator_t> info = parse_csv( first, last, v, line_info );

        if (!info.hit)
        {
            cout << "Error!!  Line: " << line_info.lineNum
                << ", Column: " << distance(line_info.lineIter, info.stop)+1 << endl;
            break;
        }


        cout << "Parses OK:" << endl;
        for (vector<string>::size_type i = 0; i < v.size(); ++i)
            cout << i+1 << ": " << v[i] << endl;

        cout << "-------------------------\n";

        first = info.stop;
    }


    return 0;
}

目录
相关文章
|
2月前
|
数据可视化 数据挖掘 BI
团队管理者必读:高效看板类协同软件的功能解析
在现代职场中,团队协作的效率直接影响项目成败。看板类协同软件通过可视化界面,帮助团队清晰规划任务、追踪进度,提高协作效率。本文介绍看板类软件的优势,并推荐五款优质工具:板栗看板、Trello、Monday.com、ClickUp 和 Asana,助力团队实现高效管理。
75 2
|
4月前
|
安全 编译器 程序员
【C++篇】C++类与对象深度解析(六):全面剖析拷贝省略、RVO、NRVO优化策略
【C++篇】C++类与对象深度解析(六):全面剖析拷贝省略、RVO、NRVO优化策略
82 2
|
1天前
|
编译器 C++ 开发者
【C++篇】深度解析类与对象(下)
在上一篇博客中,我们学习了C++的基础类与对象概念,包括类的定义、对象的使用和构造函数的作用。在这一篇,我们将深入探讨C++类的一些重要特性,如构造函数的高级用法、类型转换、static成员、友元、内部类、匿名对象,以及对象拷贝优化等。这些内容可以帮助你更好地理解和应用面向对象编程的核心理念,提升代码的健壮性、灵活性和可维护性。
|
1天前
|
安全 编译器 C语言
【C++篇】深度解析类与对象(中)
在上一篇博客中,我们学习了C++类与对象的基础内容。这一次,我们将深入探讨C++类的关键特性,包括构造函数、析构函数、拷贝构造函数、赋值运算符重载、以及取地址运算符的重载。这些内容是理解面向对象编程的关键,也帮助我们更好地掌握C++内存管理的细节和编码的高级技巧。
|
1天前
|
存储 程序员 C语言
【C++篇】深度解析类与对象(上)
在C++中,类和对象是面向对象编程的基础组成部分。通过类,程序员可以对现实世界的实体进行模拟和抽象。类的基本概念包括成员变量、成员函数、访问控制等。本篇博客将介绍C++类与对象的基础知识,为后续学习打下良好的基础。
|
4月前
|
存储 Java API
详细解析HashMap、TreeMap、LinkedHashMap等实现类,帮助您更好地理解和应用Java Map。
【10月更文挑战第19天】深入剖析Java Map:不仅是高效存储键值对的数据结构,更是展现设计艺术的典范。本文从基本概念、设计艺术和使用技巧三个方面,详细解析HashMap、TreeMap、LinkedHashMap等实现类,帮助您更好地理解和应用Java Map。
96 3
|
4月前
|
安全 C语言 C++
【C++篇】探寻C++ STL之美:从string类的基础到高级操作的全面解析
【C++篇】探寻C++ STL之美:从string类的基础到高级操作的全面解析
67 4
|
4月前
|
存储 编译器 数据安全/隐私保护
【C++篇】C++类与对象深度解析(四):初始化列表、类型转换与static成员详解2
【C++篇】C++类与对象深度解析(四):初始化列表、类型转换与static成员详解
71 3
|
4月前
|
存储 设计模式 编译器
【C++篇】C++类与对象深度解析(五):友元机制、内部类与匿名对象的高级应用
【C++篇】C++类与对象深度解析(五):友元机制、内部类与匿名对象的高级应用
59 2
|
4月前
|
程序员 开发者 Python
深度解析Python中的元编程:从装饰器到自定义类创建工具
【10月更文挑战第5天】在现代软件开发中,元编程是一种高级技术,它允许程序员编写能够生成或修改其他程序的代码。这使得开发者可以更灵活地控制和扩展他们的应用逻辑。Python作为一种动态类型语言,提供了丰富的元编程特性,如装饰器、元类以及动态函数和类的创建等。本文将深入探讨这些特性,并通过具体的代码示例来展示如何有效地利用它们。
84 0

推荐镜像

更多