DataFrame 4

불규칙한 분리기를 위해 팬더 read_csv의 분리기를 더 유연한 wrt 공백으로 만드는 방법은 무엇입니까?

불규칙한 분리기를 위해 팬더 read_csv의 분리기를 더 유연한 wrt 공백으로 만드는 방법은 무엇입니까? 파일에서 데이터를 읽어 데이터 프레임을 만들어야 합니다.read_csv방법.그러나 구분자는 매우 규칙적이지 않습니다. 일부 열은 탭으로 구분됩니다. (\t), 기타는 띄어쓰기로 구분됩니다.또한 일부 열은 2개 또는 3개 이상의 공백으로 구분하거나 공백과 탭의 조합(예: 3개의 공백, 2개의 탭, 그리고 나서 1개의 공백)으로도 구분할 수 있습니다. 팬더들에게 이 파일들을 적절하게 처리하라고 말할 방법이 있습니까? 그런데 파이썬을 사용해도 이 문제는 없습니다.사용 용도: for line in file(file_name): fld = line.split() 그리고 완벽하게 작동합니다.필드 사이에 2개..

programing 2023.10.31

반조류 판다

반조류 판다 저는 두 개의 테이블을 가지고 있는데 테이블 A의 모든 데이터만 유지되고 테이블 B의 데이터는 키가 유일한 경우에만 추가되도록 추가하고 싶습니다(키 값은 테이블 A와 B에서 유일하지만 경우에 따라서는 테이블 A와 B 모두에서 키가 발생합니다). 이 방법은 표 A에서 발생하지 않는 표 B의 값을 얻고 두 개의 표를 추가하는 일종의 필터링 조인(Anti-join)을 포함할 것이라고 생각합니다. 저는 R을 잘 알고 있고 이것이 제가 R에서 이것을 할 때 사용할 코드입니다. library("dplyr") ## Filtering join to remove values already in "TableA" from "TableB" FilteredTableB

programing 2023.10.26

각 열에 대한 합계로 데이터 프레임에 행 추가

각 열에 대한 합계로 데이터 프레임에 행 추가 각 열에 대한 값을 합산하는 행을 추가하고자 하는 데이터 프레임이 있습니다.예를 들어, 다음과 같은 데이터가 있다고 가정해 보겠습니다. x y$LOC [1] "15328" "876" "200" "16404" 가 를 에 이 으로 으로 가 를 이 에 c("Total", colSums(x[,2:3])숫자와 문자열을 모두 입력하고 모든 요소를 공통 유형으로 변환하여 모든 벡터 요소가 동일하도록 합니다.그러면 Files(파일) 및 LOC(로컬) 열에서도 동일한 현상이 발생합니다. 어떻게 하는 게 더 좋을까요?참조 adorn_totals()관리인 패키지에서: library(janitor) x %>% adorn_totals("row") #> Language Files L..

programing 2023.09.16

중복된 행의 인덱스 찾기

중복된 행의 인덱스 찾기 이 질문에는 이미 다음과 같은 답변이 있습니다. "첨자 수가 작은 요소"를 포함하여 모든 중복 행 찾기 (10개 답변) 닫힘6년 전에. R에서 중복된 기능은 중복된 행 검색을 수행합니다.만약 우리가 중복을 제거하려면, 우리는 단지 글을 쓰면 됩니다.df[!duplicated(df),]데이터 프레임에서 중복이 제거됩니다. 하지만 복제된 데이터의 인덱스를 어떻게 찾을 수 있을까요? 만약에duplicated일부 행에서 TRUE를 반환하며, 이는 데이터 프레임에서 이러한 행이 두 번째로 발생하는 것이며 해당 인덱스를 쉽게 얻을 수 있음을 의미합니다.이 행의 첫 번째 발생 지수를 구하는 방법은?아니면, 다시 말해 중복된 행이 동일한 인덱스? 저는 data.frame에 대해 루프를 만들 수..

programing 2023.09.11