1
Hello!
I have a data set, with which I intend to perform a test to analyze the influence of some predictive variables on a response variable; as there are many zeros in my response variable (there are 766 zeros of 2830 sample units)I decided to use the Hurdle Model approach. Back in R, I wrote these commands:
fórmula <- dados$BC ~ dados$z_primeiro_artigo +
 dados$z_capacidade_científica + dados$z_tamanho_corporal +
 z_reproduções_por_ano + dados$Red_List_Status +
 dados$Tipo_de_desenvolvimento | dados$z_capacidade_científica +
 dados$z_tamanho_corporal + z_reproduções_por_ano +
 dados$Red_List_Status + dados$Tipo_de_desenvolvimento
resultado <- hurdle(formula = fórmula, dist = "negbin", data = dados, na.action = "na.fail")
summary(resultado)
Call:
hurdle(formula = fórmula, data = dados, na.action = "na.fail", dist = "negbin")
Pearson residuals:
    Min      1Q  Median      3Q     Max 
-1.1840 -0.6896 -0.2369  0.1864 16.3096 
Count model coefficients (truncated negbin with log link):
                                        Estimate Std. Error z value Pr(>|z|)    
(Intercept)                           89.2998674  0.1065855 837.824  < 2e-16 ***
dados$z_primeiro_artigo               -0.0475314         NA      NA       NA    
dados$z_capacidade_científica          0.0751863  0.0048415  15.530  < 2e-16 ***
dados$z_tamanho_corporal               0.0020403  0.0006407   3.185  0.00145 ** 
z_reproduções_por_ano                  0.1797664  0.0761702   2.360  0.01827 *  
dados$Red_List_StatusEN               -0.4140505  0.1725280  -2.400  0.01640 *  
dados$Red_List_StatusLC                0.2434877  0.1372437   1.774  0.07604 .  
dados$Red_List_StatusNT               -0.2326801  0.1856711  -1.253  0.21014    
dados$Red_List_StatusVU                0.0002679  0.1702307   0.002  0.99874    
dados$Tipo_de_desenvolvimentoLarval    0.4254052  0.0928358   4.582  4.6e-06 ***
dados$Tipo_de_desenvolvimentoVivípara  0.0109588  0.3846127   0.028  0.97727    
Log(theta)                            -1.1538934  0.1093832 -10.549  < 2e-16 ***
Zero hurdle model coefficients (binomial with logit link):
                                        Estimate Std. Error z value Pr(>|z|)    
(Intercept)                            1.3147054  0.2712539   4.847 1.25e-06 ***
dados$z_capacidade_científica          0.0682073  0.0100039   6.818 9.23e-12 ***
dados$z_tamanho_corporal               0.0015036  0.0008404   1.789   0.0736 .  
z_reproduções_por_ano                  0.3522174  0.2009335   1.753   0.0796 .  
dados$Red_List_StatusEN               -0.4264203  0.1776977  -2.400   0.0164 *  
dados$Red_List_StatusLC               -0.1618832  0.1555683  -1.041   0.2981    
dados$Red_List_StatusNT               -0.2458956  0.2064901  -1.191   0.2337    
dados$Red_List_StatusVU               -0.2674147  0.1880392  -1.422   0.1550    
dados$Tipo_de_desenvolvimentoLarval    0.0385487  0.0989498   0.390   0.6968    
dados$Tipo_de_desenvolvimentoVivípara  0.1392403  0.4588545   0.303   0.7615    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
Theta: count = 0.3154
Number of iterations in BFGS optimization: 27 
Log-likelihood: -5853 on 22 Df
Warning message:
In sqrt(diag(object$vcov)): NaNs produzidos
Note that the values of the variable "z_first article" appear as "NA", and I did not understand this warning message at the end: "In sqrt(diag(Object$vcov)): Nans produced". Someone would know how to help me?