文献数据库“掌桥科研”发布有线电视文献和作者统计数据

lintkk · 发表于 2023-10-27 06:54:57

本帖最后由 lintkk 于 2024-5-12 11:33 编辑

一站式科研服务平台、文献数据库“掌桥科研”发布有线电视文献和作者统计数据

       一站式科研服务平台、文献数据库“掌桥科研”发布1982年至2022年有线电视文献和作者统计数据，这是有线电视界一件破天荒的事件，现 综合“掌桥科研”发布的消息整理如下：
有线电视的相关文献在1982年到2022年内共计408022篇，其中期刊论文10374篇、会议论文1483篇、专利文献396165篇；主要集中在电视和有线电视的基础理论，电视信号的卫星传输、微波传输、电缆传输、光纤传输、双向传输、多功能利用的理论、实践和器材方面，以及有线电视的编播和政策法规、发展展望等；相关期刊1512种，包括《电视技术》、《有线电视技术》（2020年起改名为《广播电视网络》）、《中国有线电视》、《西部广播电视》、《声屏世界》等；相关会议139种，包括2010国际传输与覆盖研讨会、第六届京、津、沪、渝有线电视技术研讨会暨第六届全国城市有线电视技术研讨会（JJHY2008 NCCTV2008）、第一届有线电视产业发展论坛大会暨第八届全国有线电视技术研讨会(NCTC·2005)等；有线电视的相关文献由9740位作者贡献，从中筛选出查开德、冯传岗、杨大伟、冯维柱、陈华等50位有线电视研究学者和他们的学术业绩。

   详情见：https://www.zhangqiaokeyan.com/subject/217696.html   https://www.zazhi.com.cn/zgyxds/

lintkk · 发表于 2023-10-29 09:15:06

本帖最后由 lintkk 于 2024-5-2 05:33 编辑

在“百度学术”中完善个人资料，非常重要，否则可能会造成学术成果统计数值偏低，可能引起业绩计算值偏低。

    目前国内有“中国知网”、“掌桥科研”、“百度学术”、“万方“”、“维普“”、“国家科技图书文献中心”等多家学术文献数据库，他们各有特点。但在统计学者发表学术论文的同时，能够公开给出比较准确的表征作者学术成就的"被引次数“、“成果数”、“H指数”和“G指数”者，只有“百度学术”一家。估计“掌桥科研”在统计和计算有线电视研究学者业绩时，可能会参考“百度学术”的这些统计数据、或者其统计计算方法。

   发表学术论文的同名者很多，“百度学术”主要是根据作者的工作单位和研究领域来甄别分人统计的（见附图）。因此，学者发表论文时签署的工作单位不同、或研究领域不同，自己又没有登录百度学术把自己所有资料完善和汇总起来，百度学术统计时就不能把所有论文统计在一个人名下，会分别统计在几个同名者名下，使搜索结果的业绩降低。如“黄冈师范学院新闻与传播学院”，研究领域为“艺术学”的李育林先生https://xueshu.baidu.com/scholarID/CN-B8G8NSFK，百度学术搜索到“发表文章：101、被引次数：252，H指数9、G指数12”；而“黄冈师范学院”，研究领域为“电子科学与技术”的李育林先生https://xueshu.baidu.com/scholarID/CN-BE75S9BJ，百度学术搜索到“发表文章17、被引次数：98，H指数4、G指数9”。计算业绩时，设备软件往往只能选择其一，必然会造成业绩数值降低。

如果在百度学术中，学者编辑自己的资料，将自己发表论文时所签署过的工作单位（黄冈师范学院新闻与传播学院、黄冈师范学院）都填进“机构”一栏，将（“艺术学”和“电子科学与技术”）都填进“研究领域”中，百度学术就会将其合成一个人的完整学术成果了。因为两个李育林先生实际上是同一位学者。

两幅附图给出在百度学术（百度文库）中完善论文作者自己资料的方法https://xueshu.baidu.com/scholarID/CN-BE75S9BJ。以及编辑完成后的界面。

其他数据库，基本上都没有类似的可操作项，同一个学者发表论文时签署的工作单位有n个，就被作为n个学者来统计成果数；甚至签署单位的文字有个别字不同（如“广电局”和“广播电视局”，“某某市广电局”和“某某广电局”）就作为不同的学者，一个全国没有同名的学者，在某个数据库里就变成30个学者了。因此，这类数据库若给出学者的H指数也是毫无用处的。

百度学术还有一个突出优点是学者自己可以添加被漏录的成果（当然必须是中国知网已经收录的论文），删除他人的成果或重复录入的成果（详见附图）。不过百度学术数据库目前还存在一个缺点，就是记不住经过学者自己矫正后的数据，过一段时间数据库刷新后，老问题可能会部分重新出现或全部重新出现（其原因下一帖提及），笔者数据近日已经过自己矫正，不知道能维持多长时间不变。

有一家文献数据库，虽然有让学者认领成果和添加成果的操作按钮，但实际上被漏落的论文是添加不了的，因为这家数据库不是收录各个学者发表的全部论文，而是有挑选的收录（不知道他们挑选论文的依据是什么，只发现笔者2000年以前发表的论文全部没有收录），他家收录多少就算这位学者的成果是多少（不是搜索统计多家数据库的资料汇总），只是已经被这个数据库挑选收录的成果漏落了才能添加，即使“中国知网”等其他数据库已经收录的论文被他们遗漏很多篇也添加不了。可见这个“添加成果的操作按钮”实际上是没有用处的。所以这家数据库给出的学者H值（同时还将同一个学者分成n个学者来计算H值）更加没有参考价值。

《中国知网》让学者认领成果和添加成果的操作办法很完善，结果准确。

lintkk · 发表于 2023-10-31 10:47:51

本帖最后由 lintkk 于 2024-1-28 11:09 编辑

“百度学术”数据库的突出优点，是能够从统计数据中计算并给出论文作者业绩的“被引频次、成果数、H指数和G指数”四项数据。这是一个难度很大的工作，因为同名同姓的作者太多了，要精准统计有同名作者的成果数是非常困难的。

      现在各数据库采取的办法通常是给出同名作者的全部论文，同时分别给出这些论文中分属各学科、各类别论文的数目，让检索者自己挑选出被检索作者可能发表的各类别论文及其数量，然后合计得出论文总数。因为同名作者发表同学科、同类别论文的几率较小，因此用这种人工检索，精确度相对较高。但是存在的问题是，或者分类太粗（如通讯、建筑、工程等），甚至找不到“有线电视”及所属项目的栏目；或者分类太细（如光缆接头、光纤熔接等），二次检索时选中一条后，其他各条全部隐藏，不能选中某作者可能发表的全部各类论文。
   “百度学术”数据库计算四项数据，不可能采用人工检索统计作者的论文总数，而是用设备软件统计，要做到很高的准确度会有难度。但基本上能全部录入每个作者的全部论文，虽然存在一些论文被重复录入现象，也是非常难得的！其他数据库绝不能做到这种程度（除非全国范围内没有重名的学者）。

      另外，百度学术给出的学者成果数，并不仅仅限于自己已经收录的该作者的论文篇数，而是扫描搜索多家数据库汇总而成的。当某一篇源论文在各数据库中录入方式及结果略有差异，被检索软件误判为不同的论文都给录入，造成同一篇论文被重复录进几次，引起四项数据值偏高。笔者用“百度学术”试统计过几位学者的成果数，发现重复录入虚增成果数（论文篇数）高达25%左右。

      再者，一稿多投，是造成某些学者业绩大幅度虚高的最大原因。如一个内容的稿件，作者对篇名或内容做少许的变动，分别投给四、五家甚至十多家不同刊物发表（这种情况在早些年杂志社刊发论文不收版面费、只支付稿酬时发生尤其多），数据库的统计软件不可能鉴别、更无从排除，会全部统计进成果数里。

      因此，任何一个文献数据库，要准确统计每一位学者的学术成果是有难度的，统计误差难免。“百度学术”能做到现在这种程度已经是非常了不起的。

lintkk · 发表于 2023-10-31 11:34:56

本帖最后由 lintkk 于 2024-1-17 19:13 编辑

关于H指数和G指数

    H指数：H-index，称为H指数，是一种评价学术成就的新方法。H代表“高引用次数”，一名科研人员的H指数是指他至多有H篇论文分别被引用了至少H次。H指数能够比较准确地反映一个人的学术成就。一个人的H指数越高，则表明他的论文影响力越大。例如，某人的H指数是20，这表示他已发表的论文中，每篇被引用了至少20次的论文总共有20篇。生物学家的H指数都偏高，表明H指数就像其他指标一样，不适合用于跨学科的比较。
   G指数：将论文按被引次数由高自低排序，将序号平方，被引次数按序号层层累加，当序号平方等于累计被引次数时，该序号则为G指数。如序号平方不是恰好等于而是小于对应的累计被引次数，则最接近累计被引次数的序号即为G指数。和H值一样，G值越大说明该学者的学术影响力越大、学术成就越高，通常作为H指数的补充或提高。

   一稿多投虽然会大幅度虚增作者发表论文的成果数，但是由于被引次数增加有限，而且会造成被引次数分散，因此对“H指数”和“G指数”的影响不是很大。可见，用“H指数”和“G指数”的高低来衡量学者的业绩大小，还是比较科学的。

   不过计算“H指数”和“G指数”前也得先做好3项配套工作：1、杜绝将一个学者分成n个学者统计成果数的做法。2、避免漏登、全部统计每个学者的成果数。3、增强统计软件的鉴别性能尽量避免重复录入统计。

   如果要更精准统计计算学者的两项指数，理论上还得要设法排除一稿多投的文稿（在早年发表论文不要版面费、只给稿酬时发生最多）和严重抄袭的论文。由于某些杂志社把控不严，这两种情况发生量不少，加上鉴别统计工作量非常大，实际上几乎不可能排除、更难做到悉数排除。

   “掌桥科研”筛选出50位有线电视研究学者的业绩数为28到11之间，大概是各位学者的“H指数”和“G指数”之和。具体计算方法没有明示，可能与“百度学术”类似。显然，要做到非常准确是有困难的，误差难免。
   还有一点我觉得可能性很大，就是科普性的有线电视技术讲座连载，“掌桥科研”没有将其纳入学术论文来计算学者业绩。因此某些在期刊上发表文章数量很多、而其中科普性的技术讲座连载占大多数的学者，没有被选进50位有线电视研究学者行列，这种做法看来是有一定道理的。

王忠章 · 发表于 2024-2-5 14:12:58

好网址，值得保存

lintkk · 发表于 2024-2-7 15:21:58

本帖最后由 lintkk 于 2024-2-13 22:04 编辑

关于提高学者业绩统计准确度的讨论意见和建议

——给各家文献数据库负责同志的信

lintkk · 发表于 2024-3-12 20:50:42

     《中国知网》的作者成果认领做得非常科学，统计的准确度可以做到最高。

   它的作者成果认领页面，设置两个认领操作按钮，一个是“推荐认领”，由知网推荐提供认领的论文。以“林挺逵”的名字被知网收录的论文有73篇，认领网页中推荐71篇让我认领，因“林挺逵”在全国没有同名者，所提供的71篇全部是我发表的论文，所以全部认领了。
   还有两篇论文没有认领到，于是打开“检索认领”的操作按钮，输进作者姓名、论文题名、论文所在网址，分两次就认领到这两篇论文。

账号		自动登录	找回密码
密码			立即注册

[资讯] 文献数据库“掌桥科研”发布有线电视文献和作者统计数据