您好,欢迎访问宜昌市隼壹珍商贸有限公司
400 890 5375jsoup 1.22.1 已正式发布,本次更新引入了对 re2j 正则表达式引擎的支持(专用于正则驱动的 CSS 选择器)、可自定义的最大解析深度设置,并包含多项缺陷修复与功能优化。
功能增强
re2j 正则引擎的支持,适用于基于正则的 CSS 选择器语法(如 [attr~=regex]、:matches(regex)),显著提升处理用户输入正则表达式的安全性。启用方式:将 com.google.re2j 添加至类路径,例如:若类路径中已存在该依赖但希望回退至 Java 原生正则引擎,可通过 System.setProperty("jsoup.useRe2j", "false") 显式禁用;调用 Regex.usingRe2j() 可验证 re2j 是否已成功激活。#2407
Parser#unescape(String, boolean),利用当前解析器配置执行 HTML 实体解码(例如支持错误定位),作为已有静态工具方法 Parser.unescapeEntities(String, boolean) 的补充实现。#2396 Parser.setMaxDepth() 手动设定上限。#2421 API 变更
问题修复
Node#replaceWith(Node) 方法中未及时清除被替换节点缓存子元素的问题,避免后续调用 Element#children() 返回异常结果。#2391 [attr=" foo "] 匹配失败)。现已完全对齐标准。#2380 ProxySelector.getDefault())曾被忽略。现已修正:当请求未显式指定代理时,自动采用系统默认代理设置。#2388,#2390 ValidationException。现改为统一记录为解析警告,不中断处理流程。#2393 IndexOutOfBoundsException。现捕获并降级为解析错误日志,保障稳定性。#2397,#2406 内部调整
org.jsoup.internal.Functions 为已弃用,计划于 v1.23.1 中彻底移除。#2412 完整更新日志请参阅:https://www./link/adb7dc747bdd4a368293
f7fd6721d6df
源码获取地址:点击下载