The Rise and Fall Tool-Related Topics in CHum

John Simpson, Geoffrey Rockwell, Amy Dyrbye, Ryan Chartier

Abstract


What can we learn from the discourse around text tools? More than might be expected. The development of text analysis tools has been a feature of computing in the humanities since IBM supported Father Busa's production of the Index Thomisticus (Tasman 1957). Despite the importance of tools in the digital humanities (DH), few have looked at the discourse around tool development to understand how the research agenda changed over the years. Recognizing the need for such an investigation a corpus of articles from the entire run of Computers and the Humanities (CHum) was analyzed using both distant and close reading techniques. By analyzing this corpus using traditional category assignments alongside topic modelling and statistical analysis we are able to gain insight into how the digital humanities shaped itself and grew as a discipline in what can be considered its "middle years," from when the field professionalized (through the development of journals like CHum) to when it changed its name to "digital humanities." The initial results (Simpson et al. 2013a; Simpson et al. 2013b), are at once informative and surprising, showing evidence of the maturation of the discipline and hinting at moments of change in editorial policy and the rise of the Internet as a new forum for delivering tools and information about them.

Quelles leçons pouvons-nous tirer du discours entourant les outils textuels? Davantage que ce que l'on pourrait croire. Le développement d'outils d'analyse de textes est une caractéristique informatique dans les sciences humaines depuis qu'IBM a commandité la production de l'Index Thomisticus (Tasman 1957) du père Roberto Busa. En dépit de l'importance des outils en sciences humaines numériques (DH), peu de personnes ont examiné le discours entourant le développement d'outils pour comprendre comment le programme de recherche a changé au cours des années. Reconnaissant le besoin d'effectuer ce genre d'enquête, un corpus d'articles provenant de l'ensemble complet de Computers and the Humanities (CHum) a été analysé au moyen de techniques de lecture à la fois éloignées et proches. En analysant ce corpus au moyen de répartitions de catégories traditionnelles ainsi que de modélisation de thèmes et d'analyse statistique, nous sommes en mesure d'acquérir des connaissance sur la façon dont les sciences numériques se sont façonnées et ont évolué comme discipline au cours de ce que l'on peut considérer comme ses « années intermédiaires », à partir du moment où le domaine est devenu professionnel (grâce au développement de publications comme CHum) jusqu'au moment où son nom a changé pour devenir « sciences humaines numériques ». Les premiers résultats (Simpson et autres 2013a; Simpson et autres 2013b), sont à fois instructifs et surprenants, démontrant la preuve que la discipline est mature et faisant allusion à des moments de changements dans la politique éditoriale et à la montée de l'internet comme nouveau forum pour fournir des outils et de l'information à leur sujet.

Keywords


Computers and the humanities, CHum, tools, topic modelling, digital humanities history

Full Text: HTML

Creative Commons License
This work is licensed under a Creative Commons Attribution 3.0 License.