17370845950

PHP 中解析并重构 JSON 数据:从原始响应到结构化输出

本文讲解如何在 php 中安全解析带有格式问题的 json 响应,修复语法错误、转换为数组、提取关键字段(如 `"name"`),并按需组织为清晰的键值对或自定义结构。

在实际开发中,通过 file_get_contents() 获取远程 API 返回的 JSON 数据是常见操作,但若原始数据存在语法缺陷(如引号缺失、嵌套不一致),直接 json_decode() 将失败并返回 null。你提供的示例 JSON 存在两个典型问题:

  1. 语法错误:"name": "T 缺少闭合双引号(应为 "name": "T");
  2. 结构异常:selection12 中的对象意外嵌套了 selection5 字段,而其他 selection* 是同级平铺结构——这极可能是服务端数据生成逻辑 Bug,必须优先修复源头,而非在 PHP 层强行“容错”。

✅ 正确处理流程如下:

1. 安全获取并解压响应

$params = http_build_query([
    'api_key' => 'your_api_key',
    'format'  => 'json'
]);

$url = 'https://api.example.com/data?' . $params;

$options = [
    'http' => [
        'method'  => 'GET',
        'timeout' => 30,
        'header'  => "User-Agent: PHP-Script\r\n"
    ]
];

$result = file_get_contents($url, false, stream_context_create($options));
if ($result === false) {
    die('API request failed.');
}

$decoded = gzdecode($result); // 若服务端启用了 gzip 压缩

2. 验证并解析 JSON(带错误提示)

// 启用 JSON 错误报告(PHP 7.3+)
$json = json_decode($decoded, true);
if (json_last_error() !== JSON_ERROR_NONE) {
    throw new RuntimeException(
        'Invalid JSON: ' . json_last_error_msg() . 
        ' at position ' . json_last_error_offset()
    );
}

3. 提取并重组数据(示例:扁平化所有 name 值)

假设目标是将每个 selection* 数组中的 "name" 字段提取为形如 {L},{100%} 的格式(注意:\nA 等后缀需清理):

$output = [];
foreach ($json as $key => $items) {
    if (is_array($items)) {
        foreach ($items as $item) {
            if (isset($item['name']) && is_string($item['name'])) {
                // 清理换行符和多余后缀,仅保留核心内容(如 "100%")
                $cleanName = trim(str_replace(["\n", "A+", "A"], '', $item['name']));
                $output[] = '{' . $cleanName . '}';
            }
        }
    }
}

// 输出为逗号分隔字符串:{L},{100%},{S},{100%},...
echo implode(',', $output);

⚠️ 关键注意事项

  • 永远不要跳过 json_last_error() 检查:未验证的 json_decode() 失败会导致后续逻辑静默崩溃;
  • 拒绝“硬编码修复”非法 JSON:用 str_replace() 补引号或删字段是危险实践,掩盖真正问题;
  • 区分数据清洗与结构转换:str_replace() 适合清理显示内容,但结构重组(如展平嵌套)必须基于合法数组操作;
  • 生产环境务必设置超时与 User-Agent:避免被服务端拒绝或长时间阻塞。

✅ 总结

你的需求本质是「JSON 解析 → 结构校验 → 字段抽取 → 格式化输出」。核心在于:先确保输入合法,再用数组函数精准操作。若服务端无法及时修复 selection12 的异常嵌套,请与其协商统一数据模型;临时方案可添加防御性判断:

if (isset($item['selection5']) && is_array($item['selection5'])) {
    // 单独处理 selection5 内容,避免污染主循环
}

最终输出完全可控——无论是 HTML 列表、CSV 还是新 JSON,都只需基于 $output 数组调用对应函数(如 json_encode() 或 fputcsv())。