Página anterior | Voltar ao início do trabalho | Página seguinte |
A REGRESSÃO SEGMENTADA COMO MODELO
Possivelmente a primeira investigação utilizando o modelo "broken line" em experimentos com peixes tenha sido conduzida com o salmão (Oncorhynchus tshawytscha) por De Long et al. (1958), tendo por base técnicas pioneiras desenvolvidas para determinação das exigências nutricionais de animais terrestres. Posteriormente, Zeitoun et al. (1976) trabalhando com truta arco-íris (Oncorhynchus mykiss), cita este modelo utilizado por H. W. Norton da Universidade de Illinois (Urbana) em 1971, em trabalhos que determinavam aspectos quantitativos da exigência de D e L-triptofano em dietas para leitões (Baker et al., 1971).
Mameesh et al. (1956) citam que o ajuste do modelo matemático da regressão segmentada é feito pelo método dos mínimos quadrados, e objetiva estimar exigências de um determinado nutriente dosado em uma dieta. O modelo propõe basicamente a existência de uma relação linear positiva de crescimento (ganho de peso) no eixo "Y" de um gráfico, em comparação a níveis dietéticos de um nutriente essencial (eixo "X"), onde é determinado o chamado "break-point" – ponto de quebra, ou seja: o ponto que representa a menor soma dos quadrados dos desvios. O ponto de quebra é considerado como o nível ideal de um nutriente necessário para o máximo ganho de peso de uma espécie (Figura 1).
Ainda nesta figura, para o nível mínimo em exigência protéica (35 %), a letra "R" representa o ponto de mudança de inclinação da reta ("quebra") da linha ascendente para horizontal, no instante em que o animal apresenta crescimento ótimo no nível mínimo necessário de proteína. Todos os valores do eixo "X" acima deste ponto são ajustados em uma equação segundo um modelo de regressão linear onde o componente funcional (ou matemático) é do tipo y = a + bx. No desenvolvimento do modelo são feitas tentativas de várias regressões usando diferentes pontos de mudança de inclinação da reta, onde a soma de quadrado dos desvios de cada regressão é obtida.
A regressão linear que fornecer o menor erro da soma do quadrado médio é considerada como melhor grau de inclinação da reta que representa a linearidade entre os níveis de doses estimados, cruzando com a resposta em ganho de peso.
DESCRIÇÃO E EXEMPLO PRÁTICO DO MODELO
Segundo Robbins (1986) o modelo de regressão segmentada consiste em duas partes: uma linha inclinada ascendente ou descendente seguida de uma linha horizontal, onde seus pontos de interseção vão determinar o ponto de quebra. Este modelo de uma inclinação é mais adequado para estimar parâmetros de crescimento. Para outros tipos de variáveis biológicas, a equação do modelo de regressão segmentada descreve duas linhas de intersecção, ambas com inclinação diferente a zero.
Segundo Robins (1986), o modelo de regressão utilizado é do tipo:
Yi = L + U(R - XLRi) + ei, i = 1,2...n1, n1+1,...,n
cujo (R - XLRi) = 0 para i ³ n1 + 1, e n1 é o número de observações até o ponto de quebra, e n é o número de pares de observações.
Este mesmo autor descreve outro modelo de regressão utilizado como sendo do tipo:
Yi = L + U(R - XLRi) + V(XGRi - R),
cujo (R - XLRi) = 0 para i > n1 e (XGRi - R) = 0 para i £ n1.
Nestes modelos, L representa a coordenada no eixo das ordenadas e R no eixo das abcissas de um ponto de quebra (ponto de quebra) em uma curva. U é o coeficiente de inclinação de uma linha quando X<R, e no modelo de duas inclinações o V representa a inclinação de uma linha quando X>R e ei é o componente aleatório ou resíduo. Assim pela definição (R-XLR) é zero quando X>R e (XGR-R) é zero quando X£R. No sistema computacional SAS, o modelo normalmente é ajustado pela determinação da menor soma de quadrados médios. Utilizando-se da anotação matricial os modelos anteriormente mencionados podem ser expressos:
1. Modelo de uma inclinação:
2. Modelo de duas inclinações:
A soma de quadrados do modelo é igual a B´X´Y. Usando um processo iterativo, podemos obter a estimativa de máxima verossimilhança de R, isto é, o valor de R que maximiza a soma de quadrados do modelo. As variâncias amostrais aproximadas de L, U, V e R podem ser estimadas da matriz de somas de quadrados e produtos das primeiras derivadas. Estas matrizes podem ser descritas como:
1. Modelo de uma inclinação:
2. Modelo de duas inclinações:
Nestas matrizes, nLR é o número de doses ou níveis com valores menores que R, e nGR é o número de doses com valores maiores que R. A matriz de covariâncias é obtida pelo produto do inverso da matriz D´D com seu erro apropriado, isto é, o quadrado médio do resíduo.
Uma outra alternativa mais eficiente no ajuste do modelo "broken-line" é ajustar iterativamente um conjunto inicial de estimativas de parâmetros até que o vetor de ajuste seja próximo de zero. Para o modelo observamos os valores de X(X1 L Xm L Xn), Y(Y1 L Ym L Yn) e um vetor inicial de estimativas dos parâmetros,
Similarmente, para o modelo de duas inclinações:
Acima, , é o valor de Y estimado para um observado valor de X usando as estimativas de parâmetros calculada na J - 1 iteração.
Como exemplo prático serão utilizados os resultados da TABELA 1 determinados por Vidal et al. (1998), em estudo que visava determinar o nível de proteína dietética ideal para a espécie tambaqui (Colossoma macropomum) em experimentos realizados na Estação de Hidrobiologia da Universidade Federal de Viçosa. Para efeito de comparação com métodos tradicionais, como o de regressão quadrática utilizado pelo autor, será feita uma plotagem dos resultados de ganho de peso encontrado pelo autor utilizando o sistema computacional SAS. O método de ajuste iterativo de um conjunto de parâmetros estimados é baseado nos procedimentos utilizados pelo SAS (1985), através do PROC NLIN. O exemplo prático de programação é apresentado na TABELA 2.
A partir dos resultados processados obtém-se a equação para o modelo de duas inclinações: e para o modelo de uma inclinação: . O modelo de uma inclinação seria o mais indicado para descrever o método proposto.
Analisando o efeito (P<0,10 – efeito quadrático) dos níveis de proteína bruta sobre o ganho de peso dos tambaquis, Vidal et al. (1998) observaram que a exigência nutricional em proteína para o tambaqui pode ser representada pela equação: cujo X é o nível protéico e Y o ganho de peso (modelo quadrático), que apresenta um ponto de ótimo 25,01%. Os resultados obtidos do processamento do programa são mostrados na TABELA 3.
Para o modelo de regressão segmentada, R2 foi estimado em 99,92% e a exigência em proteína no "break-point" em 20,05 ± 0,512. O ganho de peso neste ponto foi de 196,32g (Figura 2). Pode-se então concluir que o nível protéico ideal de 25,01%, estimado por Vidal et al. (1998), poderia estar superestimado, já que o experimento foi feito com a espécie em uma faixa de peso de 30 a 250 gramas (juvenil e crescimento) e o ideal seria que o experimento fosse feito em uma fase com uma menor amplitude de limites de peso. Em adição, os autores relatam que havia uma produção média de 248 mg m-3 de fitoplâncton no ambiente, que pode ter contribuído significativamente na dieta da espécie. Se esta contribuição do alimento natural tivesse sido levada em conta na determinação da exigência nutricional, o modelo proposto poderia estar melhor adequado.
Leandro Portz1; Carlos Tadeu dos Santos Dias2; José Eurico Possebon Cyrino3
ctsdias[arroba]carpa.ciagri.usp.br
1Pós-Graduando do Depto. de Produção Animal - USP/ESALQ.
2Depto. de Ciências Exatas - USP/ESALQ.
3Depto. de Produção Animal - USP/ESALQ, C.P. 9 - CEP: 13418-900 - Piracicaba, SP.
Página anterior | Voltar ao início do trabalho | Página seguinte |
|
|