【问题标题】:Spit sitemap for more than 50000 rows strategy in PHP / Multiple sitemap tree on index sitemap.php在 PHP 中为超过 50000 行策略吐出站点地图/索引 sitemap.php 上的多个站点地图树
【发布时间】:2011-03-30 00:34:10
【问题描述】:

我需要为一个大型广告网站制作动态站点地图,我不希望所有者手动完成这项工作并不时为所有类别生成站点地图。 为此,我正在考虑根据类别制作一个父索引 sitemap.php(生成站点地图 XML 特定代码)页面,该页面拆分并包含指向其他 sitemaps.php(生成站点地图 XML 特定代码)的链接。如果我有更多的 50000 行/站点地图,则脚本会在类别树上下降并拆分第二个子类别。这意味着我可以拥有大量站点地图子项,其中一些只有一条记录。

在我的搜索中,oodle.com 有这种策略,amazom.com 也有,但不是动态的 .php - 它是 .xml。

对于可以在索引站点地图文件中提交多少个站点地图链接,谷歌或其他搜索引擎是否有限制?

例子:

<site-idx>
  <sub href="sitemap-1-auto.php"/>
  <sub href="sitemap-2-real-estate.php"/>
  <sub href="sitemap-3-jobs.php"/>
  ...............
  <sub href="sitemap-112-software.php"/>
</site-idx>

最后一个问题如何将 index sitemap.php 提交给所有重要的搜索引擎

我需要您对此的专业意见

谢谢

【问题讨论】:

    标签: php web sitemap


    【解决方案1】:

    google 的最大政策是 50,000 个网址,您可以 ping 通

    function ping($sitemap_url){
    @file_get_contents("http://www.google.com/webmasters/sitemaps/ping?sitemap=" . $sitemap_url);
    @file_get_contents("http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=YahooDemo&url=" . $sitemap_url);
    @file_get_contents("http://submissions.ask.com/ping?sitemap=" . $sitemap_url);
    @file_get_contents("http://www.bing.com/webmaster/ping.aspx?siteMap=" . $sitemap_url);
    }
    

    【讨论】:

      【解决方案2】:

      动态站点地图没有理由。搜索引擎不会经常更新他们的搜索索引,只是没有足够的带宽。搜索引擎读取您的站点地图并将内容添加到其引擎是两件非常不同的事情。您应该创建静态 xml 文件并每月更新一次。 Google 不会在 1 天内将您的所有网址都添加到他们的索引中。

      单个站点地图文件中最多可以包含 50,000 个网址或 10MB。因此,您可以拥有一个站点地图索引文件,其中包含最多 50,000 个其他站点地图文件的链接。我管理一个站点地图文件中包含超过 700 万个 URL 的站点,我们就是这样做的,而且效果很好。除了 Google 花了一个多月的时间将所有内容添加到他们的搜索索引中。

      【讨论】:

      • 您如何生成这些站点地图?有人每月留下来让它们再生吗?对不起,我在这方面太新了。
      【解决方案3】:

      好吧,如果 mimetype 是 XML,您可能有 .php 扩展名。对于 xml 站点地图索引文件,您只需要遵循 XML 站点地图协议的“索引”文件。并且那些单独的 XML 站点地图文件也输出符合协议的内容。

      您也可以考虑尝试使用 A1 Sitemap Generator 之类的工具,但如果您的网站是一个纯 DB 网站,很容易通过 PHP 编写代码,那么这当然也是一个不错的选择。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2016-11-05
        • 2013-05-01
        • 2010-12-14
        • 1970-01-01
        • 2011-06-30
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多