O índice H é definido como o valor máximo de H, de modo que o autor/periódico fornecido publicou pelo menos artigos H que foram citados pelo menos H vezes. O índice foi projetado para melhorar medidas mais simples, como o número total de citações ou publicações. O índice funciona melhor ao comparar os estudiosos que trabalham no mesmo campo, pois as convenções de citação diferem amplamente entre os diferentes campos.
O índice H é o maior número H, de modo que os artigos H tenham pelo menos citações H cada. Por exemplo, se um autor tiver cinco publicações, com citações 9, 7, 6, 2 e 1 (ordenadas do maior ao menor), então o índice H do autor é 3, porque o autor tem três publicações com 3 ou mais citações . No entanto, o autor não possui quatro publicações com 4 ou mais citações.
Claramente, o índice H de um autor só pode ser tão grande quanto seu número de publicações. Por exemplo, um autor com apenas uma publicação pode ter um índice H máximo de 1 (se a publicação tiver 1 ou mais citações). Por outro lado, um autor com muitas publicações, cada uma com apenas 1 citação, teria um índice H de 1.
Formalmente, se f é a função que corresponde ao número de citações para cada publicação, calculamos o índice H da seguinte forma: Primeiro, ordenamos os valores de f do maior ao menor valor. Em seguida, procuramos a última posição na qual F é maior ou igual à posição (chamamos de H nesta posição). Por exemplo, se tivermos um pesquisador com 5 publicações A, B, C, D e E com 10, 8, 5, 4 e 3 citações, respectivamente, o índice H é igual a 4 porque a 4ª publicação tem 4 Citações e 5º tem apenas 3. Em contraste, se as mesmas publicações tiverem 25, 8, 5, 3 e 3 citações, o índice é 3 (ou seja, a 3ª posição) porque o quarto artigo tem apenas 3 citações.
f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3 → h-index=4f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3 → h-index=3Se tivermos a função que F ordenou em ordem decrescente do maior valor para o mais baixo, podemos calcular o índice H da seguinte forma:
h-index (f) = max { i ∈ N : f ( i ) ≥ i } {\displaystyle \max\{i\in \mathbb {N} :f(i)\geq i\}}O índice de Hirsch é análogo ao número de Theeddington, uma métrica anterior usada para avaliar os ciclistas. O índice H serve como uma alternativa às métricas mais tradicionais de fatores de impacto do diário na avaliação do impacto do trabalho de um pesquisador em particular. Como apenas os artigos mais citados contribuem para o índice H, sua determinação é um processo mais simples. Hirsch demonstrou que H tem alto valor preditivo para se um cientista ganhou honras como a associação à Academia Nacional ou o Prêmio Nobel. O índice H cresce à medida que as citações se acumulam e, portanto, depende da "era acadêmica" de um pesquisador.
O índice H pode ser determinado manualmente usando bancos de dados de citação ou usando ferramentas automáticas. Bancos de dados baseados em assinatura, como Scopus e Web of Science, fornecem calculadoras automatizadas. A partir de julho de 2011, o Google forneceu um índice H e i10 calculado automaticamente dentro do seu próprio perfil do Google Scholar. Além disso, bancos de dados específicos, como o banco de dados Inspire-HEP, podem calcular automaticamente o índice H para pesquisadores que trabalham em física de alta energia.
É provável que cada banco de dados produza um H diferente para o mesmo estudioso, devido à cobertura diferente. Um estudo detalhado mostrou que a rede de ciências tem forte cobertura de publicações de periódicos, mas baixa cobertura de conferências de alto impacto. Scopus tem melhor cobertura de conferências, mas baixa cobertura de publicações antes de 1996; O Google Scholar tem a melhor cobertura de conferências e a maioria dos periódicos (embora não todos), mas como o Scopus tem cobertura limitada das publicações anteriores a 1990. A exclusão dos documentos do processo da conferência é um problema particular para os estudiosos da ciência da computação, onde os procedimentos da conferência são considerados uma parte importante da literatura. O Google Scholar foi criticado por produzir "citações fantasmas", incluindo literatura cinzenta em suas contagens de citações e não seguir as regras da lógica booleana ao combinar termos de pesquisa. Por exemplo, o estudo MEHO e YANG descobriu que o Google Scholar identificou 53% mais citações do que a Web de ciências e Scopus combinados, mas observou que, porque a maioria das citações adicionais relatadas pelo Google Scholar eram de periódicos de baixo impacto ou um processo de conferência, eles fizeram não alterar significativamente a classificação relativa dos indivíduos. Foi sugerido que, para lidar com a variação às vezes ampla em H para um único acadêmico medido nos possíveis bancos de dados de citações, deve -se assumir que falsos negativos nos bancos de dados são mais problemáticos do que os falsos positivos e tomar o H máximo medido para um acadêmico .
Pouca investigação sistemática foi feita sobre como o índice H se comporta sobre diferentes instituições, nações, horários e campos acadêmicos. Hirsch sugeriu que, para os físicos, um valor para H de cerca de 12 pode ser típico para o avanço da posse (professor associado) nas principais universidades de pesquisa [EUA]. Um valor de cerca de 18 anos pode significar um professor completo, 15 a 20 pode significar uma bolsa na sociedade física americana e 45 ou superior poderia significar a participação na Academia Nacional de Ciências dos Estados Unidos. Hirsch estimou que, após 20 anos, um "cientista de sucesso" teria um índice H de 20, um "cientista destacado" teria um índice H de 40, e um indivíduo "verdadeiramente único" teria um índice H de 60.
Para os cientistas mais citados no período 1983-2002, Hirsch identificou os 10 principais nas ciências da vida (em ordem de diminuição de H): Solomon H. Snyder, H = 191; David Baltimore, h = 160; Robert C. Gallo, H = 154; Pierre Chambon, H = 153; Bert Vogelstein, h = 151; Salvador Moncada, h = 143; Charles A. Dinarello, H = 138; Tadamitsu Kishimoto, h = 134; Ronald M. Evans, H = 127; e Ralph L. Brinster, H = 126. Entre 36 novos indicados na Academia Nacional de Ciências em Ciências Biológicas e Biomédicas em 2005, o índice H mediano era 57. No entanto, Hirsch observou que os valores de H variarão entre os campos díspares.
Entre as 22 disciplinas científicas listadas nos limiares de citação de indicadores de ciências essenciais [excluindo assim acadêmicos não-científicos], a física tem a segunda maior citações após a ciência espacial. Durante o período de 1º de janeiro de 2000 a 28 de fevereiro de 2010, um físico teve que receber 2073 citações para estar entre os 1% dos físicos mais citados no mundo. O limiar da ciência espacial é o mais alto (2236 citações) e a física é seguida pela medicina clínica (1390) e biologia e genética molecular (1229). A maioria das disciplinas, como Meio Ambiente/Ecologia (390), tem menos cientistas, menos artigos e menos citações. Portanto, essas disciplinas têm limiares de citação mais baixos nos indicadores científicos essenciais, com os limiares de citação mais baixos observados nas ciências sociais (154), ciência da computação (149) e ciências multidisciplinares (147).
Os números são muito diferentes nas disciplinas de ciências sociais: o impacto da equipe de ciências sociais na London School of Economics descobriu que os cientistas sociais do Reino Unido tinham mais índices médios médios. Os índices H para professores ("completos"), com base nos dados do Google Scholar, variaram de 2,8 (em direito), até 3.4 (em ciências políticas), 3.7 (em sociologia), 6.5 (em geografia) e 7,6 (em economia) . Em média, nas disciplinas, um professor de ciências sociais tinha um índice H cerca de duas vezes o de um professor ou professor sênior, embora a diferença fosse a menor em geografia.
Hirsch pretendia o índice H para abordar as principais desvantagens de outros indicadores bibliométricos. O número total de artigos da métrica não explica a qualidade das publicações científicas. O número total de citações métricas, por outro lado, pode ser fortemente afetado pela participação em uma única publicação de grande influência (por exemplo, trabalhos metodológicos que proponham novas técnicas, métodos ou aproximações bem -sucedidos, que podem gerar um grande número de citações). O índice H visa medir simultaneamente a qualidade e a quantidade de produção científica.
Existem várias situações em que H pode fornecer informações enganosas sobre a produção de um cientista. Algumas dessas falhas não são exclusivas do H-Index, mas compartilhadas com outras métricas no nível do autor.
O índice H não explica o número típico de citações em diferentes campos. O comportamento da citação em geral é afetado por fatores dependentes do campo, que podem invalidar comparações não apenas entre disciplinas, mas também em diferentes campos de pesquisa de uma disciplina. O H-Index descarta as informações contidas na colocação do autor na lista dos autores, que em alguns campos científicos são significativos, embora não seja. O índice H é um número natural que reduz seu poder discriminatório. Ruane e Tol, portanto, propõem um índice H racional que interpola entre H e H + 1.
As fraquezas se aplicam ao cálculo puramente quantitativo da produção científica ou acadêmica. Como outras métricas que contam citações, o índice H pode ser manipulado por citação coercitiva, uma prática na qual um editor de uma revista obriga os autores a adicionar citações espúrias aos seus próprios artigos antes que o Journal concorde em publicá-lo. O índice H pode ser manipulado através de autocitações e, se baseado na saída do Google Scholar, até mesmo documentos gerados por computador podem ser usados para esse fim, por exemplo, usando scigen.
O índice H foi encontrado em um estudo com precisão e precisão um pouco menos preditivas do que a medida mais simples das citações médias por artigo. No entanto, esse achado foi contradito por outro estudo de Hirsch. O índice H não fornece uma medida de impacto significativamente mais precisa do que o número total de citações para um determinado estudioso. Em particular, modelando a distribuição de citações entre os documentos como uma partição inteira aleatória e o índice H como o quadrado Durfee da partição, Yong chegou à fórmula H ≈ 0,54 n {\ displaystyle h \ aprox 0,54 {\ sqrt {n {n }}}, onde n é o número total de citações, que, para os membros da Matemática da Academia Nacional de Ciências, acaba por fornecer uma aproximação precisa (com erros normalmente dentro de 10 a 20 %) do índice H na maioria dos casos.
Várias propostas para modificar o índice H para enfatizar diferentes características foram feitas. À medida que as variantes proliferaram, estudos comparativos se tornaram possíveis mostrando que a maioria das propostas está altamente correlacionada com o índice H original e, portanto, amplamente redundante, embora os índices alternativos possam ser importantes para decidir entre currículos comparáveis, como frequentemente o caso nos processos de avaliação. Essas métricas alternativas são aplicáveis a classificações no nível do autor e no nível do diário.
Os índices semelhantes ao H-índice foram aplicados fora das métricas de nível de autor.
O índice H foi aplicado à mídia da Internet, como os canais do YouTube. É definido como o número de vídeos com ≥ H × 105 visualizações. Quando comparado com a contagem total de visualização de um criador de vídeo, o índice H e o G-Index capturam melhor a produtividade e o impacto em uma única métrica.
Também foi criado um sucessivo índice do tipo Hirsch para instituições. Uma instituição científica tem um sucessivo índice do tipo Hirsch de I quando pelo menos pesquisadores dessa instituição têm um índice H de pelo menos i.