本站快讯
  • 未发布任何快讯哟,快去后台快讯发布吧

YGbook采集规则,YGbook采集规则怎么编写?

作者 : 蓝大富 发布时间: 2020-03-8 文章热度:202 共2042个字,阅读需6分钟。 本文内容有更新 字体:
  • 文章介绍
  • 评价建议
  • 目 录

    YGBook是一个实打实的小说采集系统,和通过外置工具采集不同,它是直接依靠后台采集的,官方对这部分功能看得很重,所以实现了完善的采集规则识别和多节点采集模块。在这种情况下,它可以仅仅凭借后台,就可以匹配到市面上大多数的小说网站进行采集,而且拥有很不错的采集速度。值得一提的是,官方自带的模板有特别不错的SEO效果,网站做好后收录特别快,而且程序的环境要求不高,甚至虚拟主机都可以运行的起来,当然我还是建议是在Linux系统下。

    YGbook采集规则怎么写?在使用这个YGBOOK后,也经常有小伙伴问我采集这个怎么写。。其实我也不会。然后呢,就在网上收集了一个编写的教程,放到网站来,自己还没有玩过,等有空可以来试试,各位小伙伴也可以来看看,问我我是不会的。

    下面教程开始

    首先ygbook分为单列表和多栏目匹配方式

    单列表:http://www.biquge.com.tw/

    多栏目:https://www.snwx8.com/

    区别就是多栏目有分页,可显示全部小说。

    先以单列表:http://www.biquge.com.tw/ 举例

    前面的什么图片本地化,目标网站域名,编码都不用多说了,都看得懂。其中单列表监控页面为首页,[cate]对应情况取源站顶部分类要中文的,比如玄幻小说  修真小说到最后恐怖小说依次对应本站,如果分类出入太大的,可自行在后台建分类再对应,最大页码为1.

    规则列表页码这个很好理解,比如1|1|200的意思就是从第一页开始到200页,每次增加1页。

    无缩略图标志一般为nocover,如果不是你看下源站是什么自行改即可。

    列表页:链接CSS选择器和列表页:标题CSS选择器

    这个怎么选,我们打开首页看到最近更新列表,先取大区域:#newscontent 再取一个区域 .l 区别于下方最新入库的的.r ,最后我们再取我们真正要的区域.s2 a结束,组合就是#newscontent .l .s2 a,很多人喜欢这个样子写,就跟提示差不多 #newscontent li a 有些站是可以的,但是要分清楚。

    文章页的各个选项,如果是有360结构化的站那么以下是通用的

    标题CSS选择器 :meta[property=og:novel:book_name]|content

    作者CSS选择器  meta[property=og:novel:author]|content

    缩略图CSS选择器  meta[property=og:image]|content

    内容CSS选择器一般为#intro

    因为源站简介源码一般为<div id=”intro”>,如果不是 自行修改intro即可,完结标志不用多说了。

    章节目录页:区域CSS选择器一般为:#list

    自行查看源码就知道了

    章节目录页:采集规则也看源码如biquge.com.tw为<dd><a href=”/19_19161/8850765.html”>第1章 工匠大师系统</a></dd>,那么写成<dd><a href=”[link]”>[title]</a></dd>即可。

    如果有这样子的:<span class=”swbt”><a  title=”字数:3155  更新时间:2017-11-06 08:26:14″>第九章 第二次交手</a></span>  你写成<span class=”swbt”><a href=”[link]”[string]>[title]</a></span>,把不要的用[string]代替掉即可。

    最后章节内容页:内容CSS选择器一般为#content 为什么上面也提到过 自行查看源码就明白了。

    通用替换  {filter replace=’hostloc’}笔趣阁{/filter} 如果不替换只删除的话删除hostloc即可。

    多栏目以:https://www.snwx8.com/ 为例

    规则列表页面为:https://www.snwx8.com/[cate]/.html[cate]

    对应情况以网址为准如:sort1 sort2 sort3 对应玄幻 修真 都市 页码自己填

    列表页:链接CSS选择器列表页:标题CSS选择器为#newscontent .l .s2 a

    此站没有360结构化 所以文章页:标题CSS选择器为 h1 一般都是这个

    文章页:作者CSS选择器为.infotitle  i 并在文章页:源码预过滤规则填入{filter replace=”}作者:{/filter},多栏目无需写分类。

    文章页:内容CSS选择器为 .intro 这有个问题我没解决 .intro虽然可获取 但是获取的值太多 后面的值是不想要的 提示也说了可用|分割过滤 但没搞懂。

    文章页:缩略图CSS选择器为#fmimg img|src fmimg为值 img|src为图片

    后面就不讲了,和上面差不多。

     

    还是看不懂的话,就过来看视频,地址https://www.landafu.com/10476.html

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    ①本站所有CMS、杰奇CMS、杰奇模板、PTCMS428、PTCMS模板、YGBOOK614、YGBOOK模板仅用于学习和交流,勿用于商业。
    ②本站资源有安装及使用文档,安装使用请自行探索,如您对准备购买的程序或是模板无法胜任安装工作,请点击付费安装。
    ③本站资源来源网络或者用户投稿,切勿私自传播于网络,否则将追究法律责任。且仅供学习交流之用,如有侵权请联系删除。
    ④如果资源失效或下载链接错误请联系站长。

    蓝大富博客 » YGbook采集规则,YGbook采集规则怎么编写?

    发表评论

    409+

    本站勉强运行

    272+

    用户总数

    170+

    资源总数

    0+

    今日更新

    2020-4-9

    最后更新时间