Обнаружение неисправного оборудования в огромных серверных средах — не всегда простая задача. В настоящее время можно запустить некоторый код ядра, чтобы найти неисправные процессоры или ядра, когда процесс приводит к сбою системы. Новая функция, поставленная в очередь окна слияния ядра Linux 6.1, призвана упростить этот процесс.
Облегчение поиска
Новый коммит, поставленный в очередь для ядра 6.1, будет выводить сбойные ЦП, ядра ЦП и сокеты во время ошибки сегментации. Рик ван Риэль, ответственный за это изменение, резюмирует эту функцию следующим образом:
«В достаточно большом парке компьютеров часто бывает несколько неисправных процессоров. Их часто можно определить, увидев, что некоторый часто выполняемый код ядра, который отлично работает везде, продолжает падать на одном и том же ядре ЦП в одной конкретной неисправной системе.
Тем не менее, некоторые процессоры выходят из строя годами, возникающие ошибки часто специфичны, и единственными ошибками могут быть сегментные сбои в таких программах, как bash, python или различные системных демонах, которые на других компьютерах работают нормально.
Добавьте функцию printk() в функцию show_signal_msg() для вывода информации о ЦП, ядре и сокете во время сегментации.
Это не идеальное решение, так как задача может быть перенесена на другой ЦП в промежутке между возникновением ошибки и печатью сообщения, но на практике этого достаточно, чтобы помочь людям идентифицировать несколько неисправных ядер ЦП. »
Окно слияния ядра Linux 6.1 ожидается в начале октября. Полный выпуск ядра Linux 6.1 ожидается во второй половине ноября.