이문열 평역 소설 삼국지 텍스트 데이터 분석 – 장수간의 관계 …
이문열 평역 소설 삼국지 텍스트 데이터 분석 – 장수간의 관계를 위해, 먼저 모든 권의 텍스트를 하나의 리스트로 통합해야 합니다. 이 작업을 위해 R 프로그래밍 언어를 사용하여 각 권의 텍스트 파일을 읽어 들이고 하나의 리스트에 담았습니다.
“`r
sam_1_v <-readLines("sam/sam_1.txt",encoding = detectFileEncoding('sam/sam_1.txt'))
sam_2_v <-readLines("sam/sam_2.txt",encoding = detectFileEncoding('sam/sam_2.txt'))
sam_3_v <-readLines("sam/sam_3.txt",encoding = detectFileEncoding('sam/sam_3.txt'))
sam_4_v <-readLines("sam/sam_4.txt",encoding = detectFileEncoding('sam/sam_4.txt'))
sam_5_v <-readLines("sam/sam_5.txt",encoding = detectFileEncoding('sam/sam_5.txt'))
sam_6_v <-readLines("sam/sam_6.txt",encoding = detectFileEncoding('sam/sam_6.txt'))
sam_7_v <-readLines("sam/sam_7.txt",encoding = detectFileEncoding('sam/sam_7.txt'))
sam_8_v <-readLines("sam/sam_8.txt",encoding = detectFileEncoding('sam/sam_8.txt'))
sam_9_v <-readLines("sam/sam_9.txt",encoding = detectFileEncoding('sam/sam_9.txt'))
sam_10_v <-readLines("sam/sam_10.txt",encoding = detectFileEncoding('sam/sam_10.txt'))
```
삼국지는 총 10권으로 구성되어 있으므로 각 권의 텍스트 파일을 `sam/sam_1.txt`부터 `sam/sam_10.txt`까지 순차적으로 읽어 들였습니다. `readLines()` 함수를 사용하여 각 파일의 내용을 한 줄씩 읽어 들이고, `detectFileEncoding()` 함수를 사용하여 파일의 인코딩 방식을 자동으로 감지했습니다. 이렇게 읽어 들인 각 권의 텍스트는 `sam_1_v`, `sam_2_v`, ... , `sam_10_v`라는 변수에 저장되었습니다.
이 과정을 통해 각 권의 텍스트를 독립적인 변수에 저장함으로써, 이후 분석 과정에서 필요에 따라 각 권의 텍스트에 접근하고 분석할 수 있도록 했습니다.
다음 단계는 각 권의 텍스트를 하나의 리스트에 통합하는 것입니다. 각 권의 텍스트는 독립적인 변수에 저장되어 있으므로, `c()` 함수를 사용하여 이들을 하나의 리스트로 합쳐 `sam_all` 변수에 저장했습니다.
```r
sam_all <- c(sam_1_v, sam_2_v, sam_3_v, sam_4_v, sam_5_v, sam_6_v, sam_7_v, sam_8_v, sam_9_v, sam_10_v)
```
`sam_all` 변수에는 삼국지 모든 권의 텍스트가 하나의 리스트로 저장되어 있습니다. 이제 이 리스트를 활용하여 장수 간의 관계를 분석하는 작업을 수행할 수 있습니다.
여기에서 더 많은 정보를 확인하세요: dinhvixe247.vn
Categories: 삼국지 Txt 무료 다운로드: 최신 버전
See more: dinhvixe247.vn/category/economy