登录 注册
浙大论坛 > 招聘栏目 > 浏览当前帖子 最新帖子进站窗口排行在线会员隐藏左侧栏
招聘兼职编程:英配中程序
返回本版】  【发表帖子】  【回复帖子 浏览量  2748      回帖数 0
aixueyikao    等级  

楼主 发表于  2015/11/22 14:12:55    编 辑   

英配中程序

请看附件1(英文名著3000)和2(目录)。
根据目录,请先将附件1中的每个名著分别另存为一个文件。
附件1的内部结构我们没细看,请编程人员先判断一下,有疑惑与我们谈论。
要求1(提取句子):
(1)以句号,叹号作为句子结束的符号,将名著3000的正文内容(不包括序言或其他的说明文字)的句子都提取出来。
(2)句子的下面配作者的姓名、生卒年份及著作名,著作名前面加“引自”,著作名用英文书名号,生卒年份用小括号括起来。(请看英文名著3000里的目录)
(3)将每句英文原文的中译文(见形如“附件3”的形式)配在下面,然后中文译文下面也要有作者名,著作名,但不要生卒年份。关于英文的作者名的译文我们会提供一个英汉对照的人名词典。


要求2(提取段落):
(1) 由操作者可自由设定段落的英文总词数。
(2) 将每篇名著按所设定的词数分段,但不可从原名著的自然段的中间分开,即分段的开头和结尾必须是以自然段的开头或结尾,只要分段的总词数尽量接近设定的英文总词数即可。
(3) 分段的结尾处另起行,配上作者的姓名、生卒年份及著作名,著作名前面加“引自”,著作名用英文书名号,生卒年份用小括号括起来。(请看英文名著3000里的目录)
(4) 把对应的中译文配在英文段落下面。然后中文译文下面也要有作者名,著作名,但不要生卒年份。关于英文的作者名的译文我们会提供一个英汉对照的人名词典。


我们能想到的配中译文的思路。
首先算一下总英文词数和汉字的比例(也就是一个汉字或者一个英文单词有几个英文单词或汉字与它配),给我们一个框,设置允许超出英文词数和汉字的比例差异的百分比。还要分别给中英文的每段给一个序号。按照顺序比对,段落和句子序数号是否一样。具体如下:
(1)段落配中译文:看中英文自然段的序数号是不是一样,如一样就按照序数配中英文。如超出总英文词数和汉字的比例差异百分比的打3个问号。我们更改检查后,再配句子。
(2)句子配中译文:看中英文的句子数量是不是一样,如一样就按照顺序配。配不上的打3个问号,句子数一样不打问号。

提取的句子和段落分别输出两个文件夹,文件夹里可以有诸多文件,每一个名著一个文件,文件名就是“名著名—作者名”。

注意:
(1)如正文或人名中有中点,请把中点换成空格。
(2)人名部分有句点,请注意不要把这个当作句子,可以将人名做一个表,提取句子的时将带有句点的人名排除掉。这个应该可以识别,这些人名或者是大写字母或者是以大写字母开头的。

联系方式:
QQ:2964009463
邮箱:bdzgy42303@126.com
1
表情
所有内容均为会员自愿发表,并不代表本站立场.
论坛帮助 友情链接 会员认证删帖申请 联系我们
©www.zju1.com  Processed in 0.08