2011-05-09 dataframe list matrix R 기초 R-Tips vector 데이터 형태R에서 사용하는 가장 기본적인 데이터 셋의 형태는 벡터(vector)이다. 하나 이상의 숫자, 문자 등의 집합을 벡터(vector)라고 한다. 벡터를 행과 열로 가지는 표 형식으로 확장한 것이 행렬(matrix)이다. 또한, 벡터의 집합을 원소로 가지는 데이터의 형태를 리스트(list)라 하고, 리스트에 포함된 벡터의 길이가 모두 같을 때 이를 데이터프레임(data frame)으로 취급할 수 있다. 이 장에서는 R에서 사용하는 데이터 셋의 형태에 대해서 정리해 보도록 한다. Show 벡터(vector)R은 실수, 복소수, 문자열, 논리값 등의 기본 데이터를 하나씩 단독으로 다루는 것이 아니라 같은 종류의 데이터를 여러개 묶은 벡터 형식으로 다룬다. 벡터를 만드는 가장 간단한 방법은 함수
위의 예에서 볼 수 있듯이 벡터의 원소에 숫자와 문자가 함께 포함되면 벡터의 원소들은 모두 문자(character)로 변환됨에 주의해야 한다. 어떤 값이 벡터인지 아닌지를 확인하기 위해서는 함수 벡터의 길이를 구할때는 함수
함수
R의 연산자나 많은 함수는 인수의 값이 하나의 값이 아닌 백터로 주어져도 문제없이 이용할 수 있다. 벡터 연산의 결과는 벡터이다.
벡터와 한 값의 연산은 벡터의 각 원소에 같은 조작(사칙연산)을 하지만 벡터와 벡터의 연산은 같은 위치의 원소들끼리 계산 한다.
행렬(matrix)벡터는 원소를 단지 1열로 열거해놓은 것 뿐이지만, 실제 데이터는 행과 열로 이루어진 표 형식을 따르는 것이 많다. 이러한 데이터 형식을 R에서는 행렬이라 하고, 표 형식의 데이터에 대한 분석함수를 이용하기 위해서는 미리 행렬화 시킬 필요가 있다. 행렬은 함수
리스트(list)리스트는 벡터나 행렬을 한꺼번에 취급할 수 있는 형식이다. 복수의 관련된 벡터나 행렬을 하나의 리스트에 정리하여 보존할 수 있으며 함수
데이터프레임(data frame)데이터프레임은 R에서 분석을 수행할 때 가장 빈번히 사용되는 형식이다. 외부파일로부터 R에 데이터를 불러올 때 사용하는 함수 군은 불러들인 데이터를 모두 데이터프레임으로 변환시키기
때문이다. 데이터프레임은 리스트의 한 종류로 리스트에 포함된 모든 값이 길이가 같은 벡터일 때, 혹은 행의 수, 열의 수가 같은 행렬에 한해 그 리스트를 함수
데이터프레임은 행렬의 집합으로써 작성할 수도 있지만, 많은 경우 벡터의 집합으로 사용된다. 같은 길이의 벡터의 집합인 데이터프레임은 각각의 벡터를 열 원소로 간주하는 표 형식의 데이터로 생각할 수가 있어서 행 단위, 열 단위의 데이터의 주입, 삭제, 추출조작을 할 수 있다. 또한, 데이터프레임을 작성할 때 각 열과 행에는 행의 이름과 열의 이름이 자동으로 부여된다. 열의 이름은 리스트의 참조용 이름이 사용되며 행의 이름은 함수
factor와 level벡터의 특수한 형태로 설문조사의 선택문항 등 카테고리를 저장할 수 있는 벡터인 factor라는 형태가 있다. factor는 벡터를 기본으로 하여 함수
factor 함수에서는 그 기본이 되는 벡터와
|