Норма L1 сприяє розрідженості рішень і є корисною для вибору функцій та інтерпретації моделі. Норма L2 забезпечує більш збалансоване рішення та допомагає запобігти переобладнанню.24 січня 2024 р
З практичної точки зору L1 має тенденцію зменшувати коефіцієнти до нуля, тоді як L2 має тенденцію до рівномірного скорочення коефіцієнтів. Тому L1 корисний для вибору ознак, оскільки ми можемо відкинути будь-які змінні, пов’язані з коефіцієнтами, які йдуть до нуля. L2, з іншого боку, корисний, коли у вас є колінеарні/співзалежні функції.
З усіх векторних норм норма 2, або евклідова норма, здається «особливою». В першу чергу я кажу це тому, що ми використовуємо 2 норму як засіб визначення відстані від однієї точки до іншої.
Відстань L1/Манхеттен вимірює відстань так, ніби ви переміщуєтеся системою міської сітки й можете рухатися лише вулицями (тобто в горизонтальному та вертикальному напрямках). L2 /Евклідова відстань вимірює найкоротший шлях або пряму лінію між двома точками.
По суті, як L1, так і L2 методи регулярізації протидіють надмірному оснащенню спрощення моделі та сприяння більш збалансованому розподілу ваги між функціями.
Вплив на модель Основним ефектом регулярізації L2 є скорочення коефіцієнтів до нуля, але на відміну від регулярізації L1, вона не встановлює їх до нуля. Ця усадка допомагає в зменшення складності моделі та запобігання переобладнанню, особливо в ситуаціях, коли набір даних має високо корельовані характеристики.