子群是一个语系中的一组语言,它们之间的关系比与该语系中其他语言的关系更密切,较大的语系可以在其分支中包含较小规模的语族作为其子群,即为某些具体共同特征的亲属语言,建立子群,形成语族、语支、语言、方言等概念,用来划分语言间的亲缘关系。如下图中藏语支作为藏缅语族下的一个子群,该子群里的藏语和门巴语的关系比跟该语系下其他语言的关系更密切,其中汉藏语系作为较大的语系,可以包含汉语族、藏缅语族、苗瑶语族、壮侗语族作为一个子群,藏语支下又可以包含藏语、门巴语作为一个子群。又如印欧语系的分群:印欧语系下分为印度-伊朗语族、日耳曼语族、罗曼语族、凯尔特语族、斯拉夫语族、希腊语族、波罗的语族等语族作为一个子群,日耳曼语族下分西支、北支等语支作为一个子群,西支包括英语、德语、荷兰语等语言作为一个子群,北支包括瑞典语、丹麦语、挪威语和冰岛语等语言作为一个子群。
共同创新是唯一公认的语言分群标准,因此用来语言分群的共同特征必须是这组语言的共同创新特征。例如汉语根据中古全浊声母清化“平送仄不送”的共同创新特征分出了官话方言。在语言分群中,语音创新是最常用的特征,其次是词法创新、句法创新。汪锋和王士元认为语义创新也可以作为语言亲缘分群的特征。
另一种学界常用的语言分群方法是词源统计法。词源统计法又称同源词保留率,最早由M.斯瓦迪士提出。王育德提出了利用斯瓦迪士200词在同源语言中的保留率来衡量语言之间的亲缘关系远近。王士元以侗台语的100核心词为基础,探讨了如何根据核心词中的同源相似来绘制反映语言亲缘关系远近的树形图。多位学者运用这一方法,使用斯瓦迪士的词表计算了澳越语的亲缘关系。汪锋运用共享创新和词源统计两种方法分别对白语和彝语的方言进行亲缘分群,研究结果显示不同的方法得到的结果不同。
语言分群已经发展到计量研究的阶段,通常使用Camin-Sokal算法进行计算,如有学者利用29项音韵合并(作为共同创新特征对十种官话进行语言分群,另有学者根据韵母合并、调类合并和词汇创新等20项共同创新特征对粤东闽南地区语言进行语言分群。