PHP 数组去重并累加重复项的 REPEAT 值

本文介绍如何在 php 中高效合并音乐播放列表数组中的重复项(基于 artist + title),保留唯一记录并将所有重复项的 repeat 字段值累加,适用于数据库查询后需聚合统计的场景。

在处理从数据库读取的音乐播放列表时,常遇到同一首歌曲(相同 ARTIST 和 TITLE)多次出现的情况。理想做法不是简单剔除重复,而是将其归并为一条记录,并将 REPEAT 字段累加,以反映该曲目实际出现频次。这既节省内存,又便于前端展示或后续统计分析。

以下是一个健壮、可复用的 PHP 函数实现:

function remove_duplicates($playlist) {
    $filtered = [];
    foreach ($playlist as $music) {
        // 查找已存在的同名歌曲(ARTIST + TITLE 完全匹配)
        $existingIndex = null;
        foreach ($filtered as $index => $item) {
            if ($item['ARTIST'] === $music['ARTIST'] && 
                $item['TITLE'] === $music['TITLE']) {
                $existingIndex = $index;
                break;
            }
        }

        if ($existingIndex !== null) {
            // 存在重复:累加 REPEAT 值
            $filtered[$existingIndex]['REPEAT'] += $music['REPEAT'];
        } else {
            // 首次出现:直接加入结果集
            $filtered[] = $music;
        }
    }
    return $filtered;
}

使用示例:

$music_playlist = [
    ['ID' => 1, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 2, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
    ['ID' => 3, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
    ['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 7, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1]
];

$result = remove_duplicates($music_playlist);
print_r($result);

? 输出结果:

Array
(
    [0] => Array
        (
            [ID] => 1
            [ARTIST] => SOMETHING1
            [TITLE] => SOMETHING1
            [TIME] => 04:00
            [REPEAT] => 5
        )
    [1] => Array
        (
            [ID] => 2
            [ARTIST] => SOMETHING2
            [TITLE] => SOMETHING2
            [TIME] => 02:40
            [REPEAT] => 1
        )
    [2] => Array
        (
            [ID] => 3
            [ARTIST] => SOMETHING3
            [TITLE] => SOMETHING3
            [TIME] => 03:20
            [REPEAT] => 1
        )
)

⚠️ 注意事项:

  • 本函数默认以 ARTIST 和 TITLE 作为去重联合键;如需扩展(例如增加 ALBUM 或忽略大小写),可修改判断逻辑:strtolower($item['ARTIST']) === strtolower($music['ARTIST'])。
  • 若原始数据中 REPEAT 字段可能大于 1(如批量导入已含计数),函数会正确累加而非硬设为 +1,确保语义准确。
  • 时间复杂度为 O(n²),对千级以内数据表现良好;若需处理万级数据,建议改用哈希映射(如以 "ARTIST|TITLE" 为键的关联数组)优化至 O(n)。

? 进阶提示: 数据库层聚合更高效——若源头可控,推荐直接使用 SQL GROUP BY artist, title 配合 SUM(repeat),减少 PHP 层计算压力。但当业务逻辑复杂(如需保留首个 ID、自定义时间格式等)时,PHP 后处理仍是灵活之选。