中英文核心期刊咨询网

当前位置:首页>>农业论文 > 正文

基于唐诗文本挖掘的关中地区人文景观格局研究

发布时间:2020-04-27

  摘要:关中地区作为中国历史上最早的“天府之国”,拥有丰富的自然与人文资源和独特的人文景观格局。对近400首描写关中风貌的唐代诗词进行筛选梳理,利用文本挖掘技术,通过可视化分析将关中地区划分为长安故都、行宫别苑、山水形胜、田园意境和雄关遗迹5种景观空间类型,并进一步对人文景观情感特征、景观空间分布特征和空间语义网络特征展开分析,结果表明:不同类型景观空间的词条语义有明显的相似性特征,关中地区形成了以“绿”“素”“青”“朱”为主的景观色彩分布格局,人文景观情感在区域中体现出明显的空间分异。

基于唐诗文本挖掘的关中地区人文景观格局研究

  关键词:风景园林;文本挖掘;关中地区;人文景观;唐诗

  1 研究背景

  区域经济协调发展与生态文明建设都是社会经济发展到一定阶段后对发展提出的新要求。习近平同志在庆祝改革开放40周年大会上明确提出:“实施区域协调发展战略、乡村振兴战略,加强生态文明建设。”区域协调发展作为国家经济进入高质量发展阶段的研究重点,是贯彻落实生态文明建设的必然要求,有助于优化国土空间开发格局,提升发展水平与质量。从古时“桃花源”到现代“诗意的栖居”,传统人文环境是当代人共同追求的理想与目标。如何挖掘传统人居环境的人文景观格局、探索当代理想人居的人文需求是生态文明背景下区域协调发展赋予的使命与任务。

  2 文本挖掘方法在空间分析中的人文地理研究与应用

  文本挖掘是数据挖掘的重要分支,即以数理统计学和计算机语言学为理论基础,利用信息检索技术从大量文本信息中探寻潜在的联系、规律与发展趋势等,提取有价值的信息进行更好地组织的过程。主要技术包括3类:1)数据预处理技术,涵盖分词技术、特征表示、特征提取;2)挖掘分析技术,涵盖文本结构分析、文本摘要、文本分类、文本聚类、关联分析、分布分析与趋势预测;3)可视化技术[1]。随着大数据时代的来临,文本挖掘在信息分析中的应用以及与特定领域结合已逐渐成为当前研究重点[2]。

  当前人文地理研究围绕数据挖掘,以数理模型为主、定性分析为辅,GIS为支撑,科学模拟微观人类活动与情感和地理空间的关系[3]。基于文本挖掘的人文地理学空间分析是较新的研究领域,研究重点不单是将文本的地理位置影射于空间中,还应提取对其场所的记录与感知[4]。

  目前将文本挖掘方法应用到空间分析中的人文地理研究多基于web信息探寻特定空间中人的认知评价与需求。例如陈冰洁和胡巍[5]在研究历史街区的游客感知中,通过网络文本对苏州平江路进行分析,提出相关的发展建议;王琨[6]通过网络用户贡献内容文本挖掘,分析国外游客对中国旅游关注度的空间分布特征与时空格局,为入境旅游定量化研究提供新方法;也有基于大量历史文本进行文本挖掘的空间分析,如刘元凤等[7]以《庐山志》为例提出基于传统文本的地理空间数据挖掘应用模型,实现基于文本的地理信息可视化;杨欣和赵万民[8]将山水文化体系文献类型化,从空间哲学视角总结区域整体空间的架构规律;赵佳丽[9]对明清晋商相关的大量数字化文献进行文本数据分析和社会网络定量分析,对其地理分布特征进行梳理和呈现;周政旭[10-11]则以人居环境科学为研究视角,从民族志与聚落空间信息中寻找线索,归纳聚落演变脉络与形成过程;王伟等[12]从文献史志中探寻闻喜县城的营城手法,启示现代规划方法;郑嫣然等[13]以诗词为样本运用符号语言模式探究空间与地域文化特色间的关系。

  将文本挖掘应用到空间人文地理分析,是对传统空间研究的一种辅助与完善,通过科学地分析文本中的信息,可较客观地对空间进行从宏观到微观不同层次的解析。目前文本挖掘在空间分析中的应用多侧重地理空间层面,对于人文方面研究较少且以当代数据源为主,尚无运用文本挖掘技术针对历史文本探索空间人文环境特征的研究。因此笔者基于古诗词文本,以文本挖掘为手段探索关中地区的人文景观格局,从素材选取、分析角度上具有一定的创新性和代表性。

  3诗词文本挖掘应用于人文景观格局研究的适应性与方法框架

  3.1诗词文本在空间研究中的特点和优势

  历史文学文本具有极高的文学与艺术价值,将其应用于空间研究中可以为传统空间研究提供新视角,中国学者鲜有从历史文学文本入手进行系统化的空间分析研究。与其他历史文学文本相比,诗词具有样本量大、整体意象明确、词义高度精准、空间层次清晰、空间要素明确、时间延续性等优势。诗词中除了包含大量当时的人文场景、景观环境历史和文学情感意蕴的文字表述外,还能反映和刻画宏观的地域意象感知、中观的城市环境风貌与微观的人文景观特征。针对特定区域的诗词文本研究有助于对当地人文景观格局的深层理解,通过诗词文本分析提取空间线索,可复原区域人文景观格局,对地域人文环境进行空间落实。

  3.2 诗词语义分析中的尺度特征

  古代诗词文本对空间的描述体现出明显的尺度特征。从微观尺度来说,古代诗词往往通过对景观要素和空间细节的表述来建构具有情感意象和特征的小尺度空间对象,如诗词中对“渡口”“城垣”“堂前”的描写;中观尺度聚焦于具有固定组合方式的空间场景及其地域分布规律,如古诗词中“郊”与“野”、“田”与“园”、“边”与“塞”的组合出现;宏观尺度上,古代诗词中将国土尺度的具象地理单元赋予空间和情感意义,如“西岭”“东吴”“故国”等(表1)。

  这种尺度性特征在空间分析中能够进行有效的对应,尤其是在微观和中观层面,针对特定区域能够较明确地进行空间对位和场景呈现,而在宏观层面,则更多地表现为大尺度的区域性空间连接和空间联想感知。

  3.3 人文景观格局研究中的诗词文本分析方法与框架

  通过诗词文本研究一定区域范围的人文景观格局时,首先应筛选不同历史时期对特定区域进行刻画描写的诗词文本,选取原则:1)文本描述的空间对象具备地域一致性;2)文本表述中应具备景观空间类型和尺度空间的丰富性;3)文本表述对特定场所空间与情感特征认知具有对应性。景观格局一般指景观的空间格局,是大小、形状、属性不一的景观空间单元(斑块)在空间上的分布与组合规律,景观格局是景观异质性的具体表现[14]。当前景观格局的研究在区域层面主要集中在对于区域城市景观格局演变的梳理。将诗词文本进行筛选并对每首诗词描绘空间进行梳理,提取相应坐标点,以便后期用作空间可视化分析。将所有诗词文本利用文本挖掘工具逐条进行情感分析得出相应的情感指数,结合空间坐标点导入GIS进行可视化,可用作区域人文景观情感格局分析;对诗词文本进行分词、词性分析、高频词统计、关联性分析与词义聚类分析,不同词性可用作不同感知层面的人文景观分析,聚类分析可划分不同的人文景观类型,针对这些类型可分别做出该类型的人文景观语义网络(图1)。

  由于诗词属于古汉语,不能仅按照普通的现代汉语进行分词处理,因此采取分词词条与单字词共同参考的方式,以全面真实地展现诗词中描绘的人文景观。结合高频词与高频字,即可较全面客观地展现诗词中所描绘的人文景观画像与特征。

  4 以唐代诗词为样本的关中地区空间语义与人文景观格局分析

  关中地区是中国最早的人类聚居地之一,也是历史上最早的“天府之国”。古代关中地区指“四关”之内,即东潼关(函谷关)、西散关(大震关)、南武关(蓝关)、北萧关(金锁关)。现关中地区位于陕西省中部,包括西安、宝鸡、咸阳、渭南、铜川、杨凌五市一区,总面积55623km2(图2)。

  关中地区人文景观资源丰富,具有极高的历史地位。其得天独厚的地理形势、古人传统的营城智慧、风格独到的景观构建手法,共同构建关中特有的人文景观格局,其人文景观具有极高的研究价值。笔者对关中地区人文景观格局的研究包括:1)对其核心的人文景观资源点进行梳理,在空间上进行复原和落位;2)针对诗词文本素材,通过软件分析进行语义挖掘,将文本与空间进行对应分析,总结唐代关中地区的人文景观格局整体构成,以及各类型景观空间的语义特征、情感特征、色彩特征。

  4.1 素材选取与样本处理

  描绘关中地区的诗词以唐代居多,笔者首先将唐代诗词出现地点进行汇总,进行空间落位还原了唐代关中地区主要的人文景观点分布地图(图3),进行空间落位,然后从唐代诗词中筛选出有关描写关中地区人文景观的诗词近400首,对诗词进行整理,并提取位置信息与景观分布地图进行叠合;对样本导入ROSTCM6①进行情感分析可得出关中区域整体与不同地理位置的情感感知情况,映射在地理空间上即可得到关中地区人文景观的正面情感与负面情感的分布情况;将诗词原始文本导入ROSTCM6进行分词处理,再进行词性分析。形容词通过词频统计可用作关中地区人文景观整体意象分析和色彩格局分析,名词通过语义网络分析可划分为不同的人文景观空间类型,针对不同人文景观类型也可分析其分别具有的特征。

  4.2 关中地区不同类型空间的语义分析

  对于诗词文本的转译与挖掘,首先使用超级批量文本替换(ultra-replace),依据词条的空间维度与性质,参考《古汉语词典》进行词条的标准化,进而将文本所有的源词条替换为对应的标准词条,完成转译。数据整理后,运用ROSTCM6软件进行文本挖掘,使用ROSTCM6中自带的“词频分析”功能项进行形容词和名词2类词条的词频统计分析,导出词频统计表;将词频表导入ROSTCM6中加载项工具NetDraw,构建出意境词条的可视化网络语义图谱。

  将关中地区整体形容词通过ROSTCM6进行词频分析并导入Python制作词云(图4),可看出关中地区整体描述最多的人文景观意象。

  将关中区域的形容词词条进行整体情感分析,显示正面指数0.61,负面指数0.39,结果表明关中区域整体情感感知为积极情感,但消极情感仍占有较大部分比例。将所有诗词在ROSTCM6中进行逐条情感分析,结合位置信息将结果导入GIS中,得出关中地区人文景观情感分布图(图5)。从图中可看出正面情感的空间分布大致呈西北东南向,且场所最多;中性情感空间分布相对均匀,大致呈东西向;负面情感空间分布较为集中,且场所最少。

  提取所有诗词文本中的色彩关键词,结合位置信息导入GIS中,可得出关中地区人文景观色彩分布图(图6),词频越高色彩范围越大,可看出关中地区人文景观色彩以绿、素、青、朱为主。

  人文景观类型与诗词语义的对应分析,首先将所有名词导入ROSTCM6进行语义网络分析(图7),通过软件对所有词条按照语义的近似性归类,并与唐代人文景观分布地图进行空间叠合,可以发现近似语义的词条在空间上呈现出明显的集聚性。按照空间特征和位置分布,可将所有词进行分类,可大致归纳为长安故都、行宫别苑、山水形胜、田园意境和雄关遗迹5种不同的景观空间类型(表2)。

  将以上5种类型的诗词文本进行情感指数分析(表3),可看出不同的空间类型的情感指数有很大差异,有关田园意境的正面情感指数最低,仅0.29,说明田园意境的人文景观相对更具有消极特征;行宫别苑空间的正面情感指数最高,高达0.99,其次是长安故都,为0.67,说明行宫别苑与长安故都的人文景观相较其他空间类型更具积极特征。唐代行宫在地域分布上呈现出在京都周围密集的特点[15],结合图5可看出,长安及其周边具有较多的正面情感分布点,符合客观特征。对5种空间类型进行具体的空间语义人文景观分析:

  1)长安故都。将长安故都空间类型诗词的形容词进行语义网络分析,可看出整体的空间氛围围绕“九重”一词展开(图8)。“九”在古汉语中释义为“多数”或“多次”,“九重”释义较多,可译为多层、天、宫门、朝廷、帝王皇位等。由此看来,长安故都的营城手法与人文景观空间布局原则均严格遵守“九重”这一原则,例如城市格局以象征皇权的宫城长宽为基准,城中以其等比相似形态划分,隐喻“化家为国”之意[16]。在语义网络图中,可看出与九重关联较大的词为“娇奢”“窈窕”“豪华”“十六”(指代长安十六宅)等词,均体现了当时长安城内奢华的人文景观。

  2)行宫别苑。使用相同的语义网络分析方法,可看出行宫别苑类型的人文景观尺度中,宫墙常与鼓声、照影、池塘、骊山等构成一组;宫女常与歌舞、芙蓉、白玉、温泉、城楼构成一组;渭河常与鼓楼、玉树、秦岭、华清池构成一组,此组特指华清宫的人文景观。华清宫背靠骊山,面对清渭,集聚山光水色与亭台楼榭,是唐代行宫之最[17]。不难看出,行宫别苑的人文景观与长安的气派相较,更具赏乐的成分。

  3)山水形胜。使用相同的语义网络分析方法,可看出山水形胜的景观格局中,华山三峰(东峰朝阳峰、南峰落雁峰、西峰莲花峰)与石作、松柏等组成一组;杨柳与石林、秦山、高城、碣石等组成一组;曲江与歌舞、芙蓉等组成一组,这一组即唐代曲江芙蓉园的人文景观,每年春季,百姓甚至是皇帝,均到此游玩,独具人文特色。综上可见,华山与曲江是关中山水形胜人文景观之中的重要元素。

  4)田园意境。在田园意境的景观格局语义网络分析中可看出,芳草常与垂柳、鸟声、游人构成一组;乡村常与麦苗、田夫(农夫)、野老(村野老人)等构成一组;落日常与古道、古树、渡头等构成一组;相比其他人文景观要素,田园意境相对较为低沉,符合前文的情感分析结果。

  5)雄关遗迹。雄关遗迹的景观格局语义网络分析中可看出,君臣常与江海、尘埃、长缨等构成一组,楼台常与行人、杨柳、走马、江边构成一组。这些元素的人文景观构成高远明丽、意蕴深厚,一般交织着感慨、报国、思乡等多种情感,符合情感分析的正负指数均衡特点。

  基于唐诗文本挖掘的关中地区人文景观格局研究相关期刊推荐:《风景园林》学刊创办于1993年由中华人民共和国教育部主管、北京林业大学主办,是国际性的风景园林规划与设计、城市设计以及公共艺术学刊。主要刊登风景园林(包括景观)学科及相关学科如建筑、城市规划等领域的设计实践及学术研究。

回到顶部