No mapeamento digital do solo, técnicas de aprendizado de máquina estão sendo usadas para inferir relações entre propriedades do solo e covariáveis. Informações derivadas desse processo são frequentemente traduzidas em conhecimento pedológico. Esse mecanismo é conhecido como descoberta de conhecimento. Neste estudo, mostramos que a descoberta de conhecimento com base nessa estratégia deve ser tratada com cautela. Métodos de aprendizagem de máquina podem encontrar padrões relevantes mesmo quando as covariáveis não têm sentido e não estão relacionadas a fatores e processos de formação do solo.
Nós compilamos dados de ~110000 perfis do solo de todo o mundo, bem como ~75 covariáveis ambientais com resolução espacial de 1 km. A partir desses dados, nós calibramos modelos de mapeamento digital do solo que levam em consideração, simultaneamente, ambas as dimensões horizontal e vertical do solo. A partir da aplicação desse modelo 3D, chamado SoilGrids1km, geramos mapas de uma seleção de propriedades do solo em seis profundidades padrão, com uma acurácia que variou entre 23 e 51%. Apesar da necessidade de melhorias, SoilGrids1km é o primeiro passo rumo à automação da produção global de informação do solo.