Множественные регрессионные модели для оценки содержания Zn в молоке коров

Молоко и молочные продукты являются неотъемлемой частью питания человека. Его компоненты (белки, жиры, аминокислоты, незаменимые жирные кислоты (ЖК), витамины, макро- и микроэлементы, другие биологически активные соединения) составляют основное ядро биохимии обмена в организме. При этом в ряде реакций ключевые роли остаются за макро- и микроэлементами. Например, цинк в клетках эритроидного ряда работает как молекулярный переключатель, управляющий их развитием и жизнеспособностью, входит в состав каталитического центра или выступает структурным компонентом критически значимых металлопротеинов метаболизма эритроцитов, включая дегидратазу δ-аминолевулиновой кислоты (биосинтез гема) и супероксиддисмутазу 1 (антиоксидантная защита).
Эффективность применения цинка доказана медицинскими исследованиями в профилактике и лечении. В ветеринарных и зоотехнических науках, помимо этого, цинк применяют в качестве добавки для целей повышения продуктивности. Исследования ряда авторов показали, что сульфат Zn в оболочке как дополнительный источник элемента стимулирует ферментацию в рубце, переваривание и повышает продуктивность молочных коров.
Применение цинка в форме оксида повышает качество молока для переработки, существенно снижая количество соматических клеток и повышая устойчивость липидов молока к окислению, что важно для хранения и переработки. По-видимому, отчасти это происходит за счет изменения в соотношении ЖК (снижения концентрации насыщенных, повышения ненасыщенных олеиновой, вакценовой, руменовой кислот), повышения концентрации карбоновых кислот, альдегидов и сложных эфиров.
Особенность метаболизма Zn заключается в том, что элемент плохо депонируется организмом и токсичен в избытке, что требует его регулярного поступления в оптимальных дозах. Это важно в вопросах ветеринарно-санитарного контроля безопасности продукции животного происхождения и профилактике микроэлементозов молочных коров. При этом различные системы управления молочно-товарными фермами по-разному подходят к вопросам контроля микроэлементов. Безусловно, оптимально учитывать их состав во всех критически важных объектах хозяйственной деятельности — почве, урожае, кормах, организме и продукции, что учитывают и прогнозируют еще на этапе планирования, для чего с успехом применяются методы математического моделирования.
В работе авторы предлагают простую модель регрессионного анализа для регулярного мониторинга уровня Zn в молоке по данным о его пищевой ценности и физико-химических свойствах.
Модели регрессионного анализа успешно применяются при исследованиях в агропромышленном комплексе. Например, методика линейного описания экстерьерных статей позволяет определять породные (индивидуальные) особенности телосложения животных молочного типа, что повышает качество селекционной работы, генно-биометрические модели макроэкономических процессов в племенном животноводстве используют в зонах рискованного земледелия. Активно используются методы геномного прогнозирования, в том числе для малонаследуемых репродуктивных признаков. Опираясь на корреляционный анализ, установлены положительные корреляции для Pb-белка, Cr-протеина и Cd-лактозы.
Цель данной работы — прогнозирование содержания цинка в молоке с помощью модели уравнения множественной регрессии на базе данных по биохимическому составу.
Материалы и методы исследования
Отбор образцов молока производили у здоровых коров второй лактации черно-пестрой породы из Племенного завода «Ладожское» (Краснодарский край, Россия) в 2022—2023 году.
Содержание привязное с выгулами в летнем лагере (n = 110).
Во время контрольных доек отбирали среднюю пробу молока согласно ГОСТ 26809.1.
Биохимический анализ показателей молока коров выполнен по ГОСТ 32255-2013 с помощью системы MilkoScan 7 / Fossomatic 7 DC (Дания).
Исследование цинка выполнено методом атомно-абсорбционной спектрометрии на анализаторе ZEEnit 650 P (Analytik Jena, Германия).
Статистическую обработку данных, корреляционный анализ и построение множественной регрессионной модели осуществляли в программе Microsoft Exсel при помощи пакета «Анализ данных» (Microsoft, США).
Прогнозируемый показатель — содержание Zn в молоке коров; независимые переменные для прогноза — массовая доля жира (МДЖ), массовая доля белка истинного (МДБи), массовая доля белка общего (МДБо), лактоза (Л), сухой обезжиренный молочный остаток (СОМО), сухое вещество (СВ), точка замерзания (ТЗ), кислотность (pH).
Вид модели множественной регрессии линейный:
Zn = b0 + b1*x1 + b2x2 + … + bn*xn,
где: b0 — сдвиг; b1-n — коэффициенты отклонения для переменных x1-n.
Распределение данных на нормальность определяли по критерию теста Харке — Бера. Значения и оценка коэффициентов регрессии выполнены по методу наименьших квадратов. Проверку качества уравнения регрессии проводили по коэффициенту детерминации (R2), F-статистики и ее вероятности.
Оценку значимости каждого фактора и достоверность коэффициентов линейной регрессии определяли с помощью t-статистики. Оценку мультиколлинеарности проводили по матрице корреляций и фактору инфляции дисперсии (ФИД) для каждого параметра в конкретном уравнении.
Результаты и обсуждение
Результаты анализа первичных данных представлены в таблице 1.

Нормальность распределения данных подтвердили для всех показателей, кроме цинка по тесту Харке — Бера (табл. 1). Подбор модели прогнозирования уровня цинка проводили без исключения выбросов (уравнения 15).
Изначально при построении регрессионной модели для вычисления содержания Zn в молоке коров были учтены все данные биохимического анализа молока. Модель уравнения 1 включает константу и имеет коэффициент множественной корреляции ниже 0,50, хотя и значима по F-критерию. Полученные коэффициенты для константы, МДЖ, МДБи, МДБо, лактозы, СОМО и СВ — незначимы по t-критерию Стьюдента и имеют высокий (более 10) фактор инфляции дисперсии (ФИД), кроме переменных ТЗ и Рн.
Zn = -899 + 3893 × МДЖ + 8516 × МДБи – 9992 × МД – Бо + 161 × Л + 4635 × СОМО – 3630 × СВ –
– 67 × ТЗ + 5233 × pH (1)
р = 0,96; 0,14; 0,31; 0,31; 0,96; 0,25; 0,18; 0,001; 0,06 соответственно
ФИД = 317,51; 723,62; 840,02; 17,39; 210,77; 491,68; 2,10; 1,64 соответственно
Модель уравнения 2 построена без константы. Это позволило повысить значение множественной корреляции на 0,47, нормированного R2 — на 0,69 (табл. 1), подтвердило значимость по F-критерию и незначительно повлияло на параметры оценки переменных. При этом основная масса задействованных в расчетах переменных по-прежнему незначима.
Zn = 3958,7 × МДЖ + 8538,1 × МДБи – 10019,2 × МДБо + 172,9 × Л + 4709,4 × СОМО-3698,9 × СВ – 67,4 × ТЗ + 5121,6 × рН (2)
р = 0,07; 0,30; 0,30; 0,95; 0,20; 0,11; 0,0002; 0,0004 соответственно
ФИД = 227,70; 727,80; 844,74; 17,42; 179,15; 351,22; 1,55; 0,43 соответственно
Далее усовершенствование полученных моделей проводили решением проблемы мультиколлинеарности, исключив взаимосвязанные дублирующие факторы, находящиеся между собой в линейной зависимости, что определяли по коэффициенту корреляции (если r ≥ 0,7, одну из переменных исключали).
Для переменных установили: МДЖ и СВ (r =0,91); МДБи и МДБо (r = 1,00); СВ и МДБи/МДБо (r = 0,67 / r = 0,67); СОМО и МДБи/МДБо (r = 0,91 / r = 0,92). После исключения в модели остались: МДЖ, МДБи, лактоза, ТЗ, рН.
Для уравнения 3 константу вернули, для уравнения 4 исключили.
Zn = -13734,3 + 395,1 × МДЖ + 468,1 × МДБи + 624,5 × Л-59,3 × ТЗ + 6431,8 × рН (3)
р = 0,39; 0,01; 0,23; 0,48; 0,001; 0,01 соответственно
ФИД = 1,25; 1,49; 1,87; 1,49; 4,02 соответственно
Модель уравнения 3 с константой имеет коэффициент множественной корреляции менее 0,50 и значима по F-критерию. Полученные коэффициенты для МДЖ, ТЗ, рН значимы по t-критерию Стьюдента и имеют ФИД менее 10.
Zn = 394 × МДЖ + 534,5 × МДБи + 841,7 × Л – 64,6 × ТЗ + 4583,4 × рН (4)
р = 0,01; 0,16; 0,31; 0,0001; 0,001 соответственно
ФИД = 1,26; 1,44; 1,73; 1,30; 1,17 соответственно
Модель уравнения 4 построена без константы, что позволило повысить значение множественной корреляции на 0,58, нормированного R2 — на 0,66 (табл. 1). Уравнение значимо по F-критерию, полученные коэффициенты для МДЖ, ТЗ и рН значимы по t-критерию Стьюдента и ФИД.
В модели 5 исключили незначимые переменные по t-критерию Стьюдента — МДБи и лактозу.
Zn = 420,4 × МДЖ – 55,2 × ТЗ + 4684,0 × рН (5)
р = 0,006; 0,0001; 0,00003 соответственно
ФИД = 1,15; 0,97; 0,72 соответственно
Уравнения 2, 4 и 5 равноценны при сравнении нормированного R2 и значимы по F-критерию. Самое простое (с меньшим количеством переменных) — уравнение 5. Кроме того, после исключения незначимых по t-критерию Стьюдента переменных для МДЖ, ТЗ и рН остаются приемлемыми значения р и ФИД.
В таблице 2 приведены «меры согласия» для описанных выше моделей и оценка их взаимосвязи с исходными данными.

При апробации полученных уравнений и сопоставлении расчетных результатов с фактическими данными прибора статистически значимых различий не обнаружено (р = 0,66, р = 0,86, р = 0,99, р = 0,89, = 0,99 для уравнений 1–5 соответственно), полученные методом расчетов данные ложатся в диапазон между первым (2081,0 мкг/л) и третьим (3620 мкг/л) квартилем фактически полученных результатов.
Все полученные модели регрессионного уравнения позволяют удовлетворительно описать среднее значение уровня Zn в молоке для исследуемой популяции. Наиболее предпочтительно уравнение 5.
Выводы
Уровень Zn в молоке коров зависит от большого количества факторов — как внешних, так и внутренних. Межквартальный размах в группе по данному показателю составил 1539,0 мкг/л (коэффициент вариации (КВ) 48%). При этом данные биохимического анализа молока (МДБи, МДБо, лактоза и т. д.) более консервативны КВ для МДБи, МДБо, лактозы, СОМО, СВ, ТЗ, рН, менее 15%, за исключением МДЖ, где КВ составил 26%.
Выявление и ранжирование факторов биохимического анализа по степени их влияния на результирующую переменную (Zn) показали высокую значимость переменных МДЖ, ТЗ и рН в лучшей из полученных моделей регрессионного уравнения 5. Для этой же модели все полученные коэффициенты значимы по t-критерию Стьюдента. Во многом этому способствовало исключение дублирующих факторов при решении проблемы мультиколлинеарности после анализа матрицы коэффициентов корреляции и контроля по фактору инфляции дисперсии для каждой из переменных в разных вариантах уравнения.
Разработка и применение регрессионных уравнений могут стать существенным подспорьем при прогнозировании уровня обеспечения молочных коров Zn в среднем по стаду и поступления его в продукцию. Полученные модели могут быть доработаны и усовершенствованы при получении новых данных.
Поскольку уровень Zn будет в значительной степени зависеть от фактора кормления, коррекцию результатов анализа фактического и математического лучше проводить параллельно со сменой рациона или какого-либо из компонентов рациона, хотя вопросы кормления и не были затронуты в ходе работы.
Об авторах
Оксана Александровна Воронина; кандидат биологических наук, старший научный сотрудник отдела физиологии и биохимии сельскохозяйственных животных
voroninaok-senia@inbox.ru; https://orcid.org/0000-0002-6774-4288
Федеральный исследовательский центр животноводства — ВИЖ им. академика Л.К. Эрнста, пос. Дубровицы, 60, Подольск, Московская обл., 142132 Россия
УДК 636.39.034, 637.12.04/.07
DOI: 10.32634/0869-8155-2024-389-12-153-157