今天在 上看到一个查询股票信息的小代码, 自己也跟着作者的设计思路写了一个小实例.
我把该代码加到了自己的代码库中.
在看到查询中涉及到csv文件时有点不明白, google一下, 贴上学习学习!
原文:
csv文件及其使用
在集图的过程中,你肯定会常常听到csv文件这个词。那么所谓csv文件到底是个什么东西呢? 它有什么用处呢?又要如何使用呢?认真读完下面的文字,相信你对csv会有一个初步的了解。
所谓“csv”,是comma separated value(逗号分隔值)的英文缩写,通常都是纯文本文件。 下面是一个实际csv文件中的部分内容,让大家对他有一个感性的认识。我们选的是sjojo_rescan 的csv文件(sjojo是asw-亚洲扫图风的成员之一)。
sj_mino1001.jpg,715282,4fb55fe8,
sj_mino1002.jpg,471289,93203c5c,
sj_mino1003.jpg,451929,c4e80467,
通常csv文件开头是不留空的,以行为单位,每行中记录一张图片的了多项数据,每项数据用逗号 来分隔(标准英文逗号)。一般说来集图用的.csv文件的格式是这样的:
文件名,文件大小(以字节为单位),crc校验值,注释(可省略)
sj_mino1001.jpg,715282,4fb55fe8,
| | | |
文件名 文件大小 crc值 注释(已省略)
如果你的机器上装了microsoft excel的话,.csv文件默认是被excel打开的。需要注意的是,当你 双击一个.csv文件,excel打开它以后即使不做任何的修改,在关闭的时候excel往往会提示是否要 改成正确的文件格式,这个时候千万记得要选择“否”。因为excel认为.csv 文件中的数字是要用 科学记数法来表示的,而我们要的.csv文件中的数字是普通的。如果你选择了“是”的话,excel 会把csv文件中所有的数字用科学计数来表示(2.54932e 5这种形式),这个文件就没法用了。 所 以如果你的csv文件绝大部分都是用在集图上的话,建议把.csv的默认打开方式改成任意一个文本 编辑器,系统自带的记事本就是个不错的选择。
好,让我们回到csv文件的格式中来。见上面,从左到右 sj_mino1001.jpg是文件名,715282 是以字节表示的文件大小。当文件名中包含逗号的时候,由于逗号在csv文件中特殊的作用,为了 不至于产生歧义,需要用引号把文件名括起来。比如 "the art, fantasy.jpg",384211,...,.... 接着是一个8位的16进制数字 4fb55fe8,这是文件的crc32校验值。整个csv文件的精髓都在这里。
让我们举个小例子来说明它的意义:sjojo发布了一张图sj_mino1001.jpg,假设你是从朋友手中拿 到这张图的,那么你肯定常常会有这样的疑问,这张图在传播的过程中是否被改动过呢?是否无意 中遭到了损坏呢?crc就是为解决这个问题而存在的。一般情况下,扫图家每发布了一套图,就同 时放出一个csv文件(这种csv通常叫做official csv,也就是官方发布的csv的意思),这个csv中 的crc值是用专门的软件通过crc32算法(常用的crc算法还有crc16)对文件运算后生成的一个值, 这个值可用作文件真身的标志。在绝大多数情况下,如果这个文件在传播过程中无论是大小还是内 容被改动过。那么,用同样的crc32算法再对文件进行运算后产生的crc校验值就完全不一样了。如 果得出的crc值是一样的,则完全有理由认为这个文件是真身,没有被改动过。还有些时候,收来 的图片文件名被改动过了,那么你怎么知道谁是谁呢?这个时候crc值又起作用了:用专用的软件对图片处理后,可以得到文件的大小和crc值,然后根据大小和crc值在csv中寻找是否有适合的图片。如果有,就会把图片的名字改成csv里的。举个例子,你收到了一张图片,名字是pic0001.jpg,同时你知道这张图片是sjojo_rescan这个集子里面的,但是不知道具体是哪一张。用软件得到它的大小和crc分别是715282和4fb55fe8,那么软件在csv文件里找到一行sj_mino1001.jpg,715282,4fb55fe8,大小和crc都符合,软件就认为这张图片的原名是sj_mino1001.jpg,接着自动把文件的名字改成sj_mino1001.jpg。改动的不是csv文件而是图片的文件名。接下来的是注释和说明,可以省略掉。需要注意的是注释的后面是没有逗号的,如果要省略注释的话,一定要在crc值的后面保留一个逗号,否则软件会把crc值认为是注释的。
相信看完上面的一大堆东西后,你不但对csv文件有了个大概地了解,对它的用途应该也有些模糊的概念了吧。我们收集图片往往是通过各种各样不同的渠道,比如从网站上,irc上,抑或干脆是朋友送的光盘。在整个的传播过程中,图片有可能遭受到各种各样的非人待遇。尤其是从网站上收来的图片。有些时候仅仅是简单的改了一下名字,更多的时候由于很多plmm站空间有限,常把图片的尺寸缩小,或者把图片文件缩小。一张1356x588的图被改成了678x294,或者一个四五百k的文件被缩成了几十k都是常有的事。比较可恶的是,许多网站把原来扫图家的logo去掉,打上自己网站的logo。还有些许搞笑派的玩家,把各种各样的图片移花接木,改头换面。这些对于一般的看图娱乐无伤大雅,但是对于集图来说,收到这样的图片是无法容忍的。如何验明图片的正身,这是扫图家和集图者共同面对的问题。csv文件就是为了解决这样的问题而出现的。csv文件最早用在简单的数据库里,由于其格式简单,并具备很强的开放性,所以起初被扫图家用作自己图集的标记。 如上面所说的,csv文件是个纯文本文件,每一行表示一张图片的许多属性。你在收一套图集时,只要能找到它的csv文件,用专用的软件校验后,你对该图集的状况就可以了如指掌。比如这套图一共有多少张,你收到了多少张,哪些是原图,那些是可能被改动过或者损坏了的图片......我们可以把.csv文件看作一份索引,你不但可以“按图索骥”,还可以检查自己收来的“马子”血统是 否纯正。
csv文件的来源通常有两种:一种是扫图家自己发布的csv,一般称作official csv。也就是官方发布的csv,通常说来是有相当的权威性的。比较特殊的是亚洲的许多扫图家,除了公开发布的图以外,还有一些私下发布的special图,或者一些专门送给朋友的图。加上扫图家不愿意或者不会做csv,所以他们图集的csv往往由集图界中一些资深前辈出头来做。在这种情况下,往往会出现一个图集有好几个版本的csv文件,并且每个版本之间都有不小的差别。此时的csv不仅是验明真身的依据,同时也给了集图者一个希望:即使缺的再多,即使用这个版本csv收全的人再少,一定会有一个人是全的,就是此csv的作者!集图界前辈liqing有一句名言:“有csv就表示一定有图!” 自然而然的,民间现了一些权威的做csv的玩家。比如早期的edzone,现在依然活跃的osun,shum,vsam,te,paul... 还有偶们coc图盟的wqc
好了,说了那么多,大家可能会问,csv文件那么好用,到底要怎么用呢?不会要自己手工来检测吧?呵呵,还记得上文中一再出现的“软件”这个字眼吗?有专用的软件可以帮助我们完成这项工作。常用的软件有the!checker和the hunter。目前这两个软件都有汉化的简体中文版,汉化人是来自北方的snowtank(感谢snowtank)
阅读(1997) | 评论(0) | 转发(0) |