【问题标题】:hpple HTML Parsing Library Not Parsing Correctly on iOS 7hpple HTML 解析库在 iOS 7 上无法正确解析
【发布时间】:2013-09-13 04:07:53
【问题描述】:

我在我的 iOS 应用程序中使用 hpple 解析库。 https://github.com/topfunky/hpple

我遇到了一个问题,即解析器在 iOS 7 上没有正确解析我的 HTML 页面。它在 iOS 6 上被正确解析,我得到了返回的对象。在 iOS 7 上,我只返回了部分解析和错误的解析。库在iOS 7上错误读取HTML。我已经尝试调试问题并得出结论,问题出在此方法上。

NSArray *PerformXPathQuery(xmlDocPtr doc, NSString *query)
{
  xmlXPathContextPtr xpathCtx;
  xmlXPathObjectPtr xpathObj;

  /* Create xpath evaluation context */
  xpathCtx = xmlXPathNewContext(doc);
  if(xpathCtx == NULL)
    {
      //NSLog(@"Unable to create XPath context.");
      return nil;
    }

  /* Evaluate xpath expression */
  xpathObj = xmlXPathEvalExpression((xmlChar *)[query cStringUsingEncoding:NSUTF8StringEncoding], xpathCtx);
  if(xpathObj == NULL) {
    //NSLog(@"Unable to evaluate XPath.");
    xmlXPathFreeContext(xpathCtx);
    return nil;
  }

  xmlNodeSetPtr nodes = xpathObj->nodesetval;
  if (!nodes)
    {
      //NSLog(@"Nodes was nil.");
      xmlXPathFreeObject(xpathObj);
      xmlXPathFreeContext(xpathCtx);
      return nil;
    }

  NSMutableArray *resultNodes = [NSMutableArray array];
  for (NSInteger i = 0; i < nodes->nodeNr; i++)
    {
      NSDictionary *nodeDictionary = DictionaryForNode(nodes->nodeTab[i], nil,false);
      if (nodeDictionary)
        {
          [resultNodes addObject:nodeDictionary];
        }
    }

  /* Cleanup */
  xmlXPathFreeObject(xpathObj);
  xmlXPathFreeContext(xpathCtx);

  return resultNodes;
}

调用此方法时,doc 和 query 不为零。我不知道如何在此方法中记录其他类,也不知道其中哪一个返回了错误的解析。可能问题出在苹果的 libxml2.dylib 上

直到方法结束,我才确切知道代码在方法中做了什么。任何帮助都将不胜感激,因为我很困惑为什么该库无法在 iOS 7 上解析它可以在 iOS 6 上解析的相同 HTML 页面。

在 iOS 7 上,此库可以正确解析其他应用程序中的其他 HTML 页面。我用来解析启动解析器的代码是

 NSData *htmlData = [NSData dataWithContentsOfURL:dataURL];

    TFHpple *dataParser = [TFHpple hppleWithHTMLData:htmlData];

    NSString *dataXpathQueryString = @"//td[3]";
    NSArray *dataNodes = [dataParser searchWithXPathQuery:dataXpathQueryString];

    NSMutableArray *newData = [[NSMutableArray alloc] initWithCapacity:0];
    for (TFHppleElement *element in dataNodes) {

        data = [[GFCData alloc] init];
        [newData addObject:data];
        data.title = [[element firstChild] content];

        data.title = [data.title stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
    }

dataURL 是http://www.gfchurch.com/ru/pages/video.php?a=5&b=51&c=37

如果需要,我可以提供更多信息。

【问题讨论】:

  • 你要解析的输入数据是什么?
  • 数据URL。 HTML 页面链接位于问题的底部。
  • 有问题的 HTML 无效。
  • 为什么 HTML 在 iOS 6 上有效,但在 iOS 7 上无效?
  • @Mr.Russian HTML 的有效性与您解析它的操作系统无关。不管怎样都是无效的。也许库(Objective-C 或 libxml2)在 iOS 6 上比在 iOS 7 上更宽松(无论出于何种原因)。

标签: iphone ios objective-c parsing


【解决方案1】:

通过在searchPathQuery 中不使用// 解决了这个问题。我应该再次测试这个问题,因为这个库是一个月前更新的,也许问题已经解决了。

【讨论】:

    【解决方案2】:

    我通过@xmlXPathRegisterNs@正确管理命名空间解决了这个问题

    我没有解析 HTML 的问题,而是 SOAP 响应。

    【讨论】:

    • 你能举个例子说明你是如何解决的吗?我通过在 searchPathQuery 中不使用 // 解决了这个问题。
    猜你喜欢
    • 2015-09-27
    • 2013-02-17
    • 2011-02-21
    • 2012-08-24
    • 2013-04-15
    • 2019-03-01
    • 1970-01-01
    • 1970-01-01
    • 2012-08-10
    相关资源
    最近更新 更多