목록분류 전체보기 (303)
군침이 싹 도는 코딩
판다스의 데이터 값 수정 방법 df >>> bikes pants watches glasses store 1 20 30 35 NaN store 2 15 5 10 50.0 df.loc['store 2','watches'] = 20 df >>> bikes pants watches glasses store 1 20 30 35 NaN store 2 15 5 20 50.0 ## 기호( = ) 기준으로 왼쪽에는 데이터 억세스 오른쪽에는 저장할값을 넣는다. 판다스에 새 컬럼을 넣는법 df >>> bikes pants watches glasses store 1 20 30 35 NaN store 2 15 5 20 50.0 # shirts 라는 컬럼을 만들고 , store 1 에는 15개 store 2 에는 2개 df['s..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dPYCVF/btrRXaKhQ6T/4yCy2XKl8n0BkrMvdBx8kk/img.png)
판다스의 2차원 데이터 처리는 데이터 프레임(DF)로 한다 데이터 분석에서는 csv 파일을 판다스의 데이터프레임으로 읽어와서 작업한다 import pandas as pd # We create a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])} 왼쪽의 행부분의 진한 글씨는 인덱스 윗쪽의 열부분의 진한 글씨는 컬럼 안쪽에 있는 데이터는 values 라고한다 데이터 프레임 데이터 타입별로 불..
pandas Series 연산 index = ['apples', 'oranges', 'bananas'] data = [10, 6, 3,] frults=pd.Series(data=data,index=index) frults >>> apples 10 oranges 6 bananas 3 dtype: int64 # 전체 5개씩 증가되었다. frults+5 >>> apples 15 oranges 11 bananas 8 dtype: int64 # 오렌지가 2개 팔렸다 frults['oranges']-2 >>> apples 15 oranges 9 bananas 8 dtype: int64 # 사과랑 바나나가 3개씩 팔렸다. frults[['apples','bananas']] - 3 # 두개 이상일 경우 안에 리스트를 ..
Pandas 의 장점 기본적인 통계데이터 제공 NaN values 를 알아서 처리함. 숫자 문자열을 알아서 로드함. 데이터셋들을 merge 할 수 있음. Pandas Series 데이터 생성 index = ['eggs', 'apples', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] import pandas as pd grocerles=pd.Series(data=data,index=index) # grocerles >>> eggs 30 apples 6 milk Yes bread No dtype: object Pandas Series 데이터 확인법 grocerles >>> eggs 30 apples 6 milk Yes bread No dtype: object # 인덱스를..
● 1차원 데이터(벡터)를 억세스하는법 x >>> array([83, 40, 73, 54, 31, 76, 91, 39, 90, 25]) x[2] >>> 73 ● 2차원 데이터(행렬)를 억세스하는법 X >>> array([[13, 22, 49, 42, 80], [91, 63, 58, 20, 34], [60, 40, 16, 37, 66], [ 2, 44, 16, 87, 84]]) X[1][2] >>> 58 ● 1차원 데이터(벡터)를 슬라이싱 하는법 x >>> array([83, 40, 73, 54, 31, 76, 91, 39, 90, 25]) x[2:6+1] >>> array([73, 54, 31, 76, 91]) ● 2차원 데이터(행렬)를 슬라이싱 하는법 X >>> array([[13, 22, 49, 42..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bqOLSO/btrRRX5BNJm/0lKyKE3gSYwemtjwLhcQDK/img.png)
● 액시스를 사용하여 2차원 데이터를 연산 하는법 X >>> array([[13, 22, 49, 42, 80], [91, 63, 58, 20, 34], [60, 40, 16, 37, 66], [ 2, 44, 16, 87, 84]]) X.max(axis=1) # 각 행의 최대값 >>> array([80, 91, 66, 87]) X.min(axis=0) # 각 열의 최소값 >>> array([ 2, 22, 16, 20, 34]) X.sum(axis=0) # 각 열의 합 >>> array([166, 169, 139, 186, 264]) X.mean(axis=1) # 각 행의 평균값 >>> array([41.2, 53.2, 43.8, 46.6])
● 넘파이에서 랜덤값으로 채워진 배열을 만드는법 np.random.random(3) >>> array([0.31151381, 0.33843259, 0.07152977]) ● 넘파이에서 랜덤 정수로 채워진 배열을 만드는법 np.random.randint(1,6,10) # (start,stop,size = shape) >>> array([1, 4, 3, 4, 5, 4, 5, 4, 3, 2]) np.random.randint(1,6,(3,4)) # 2차원으로 만드는 법 >>> array([[1, 1, 5, 1], [3, 5, 2, 1], [4, 4, 3, 4]])
Numpy 는 데이터를 효율적으로 저장할수있는 data structure 이다. ● Numpy를 만드는 법 import numpy as np # 1차원 데이터 (벡터) 를 만드는법 x=np.array(a) x >>> array([1, 3, 2, 8, 4]) # 2차원 데이터 (행렬) 를 만드는법 X=np.array( [ [10,4] , [6,8] ] ) X >>> array([[10, 4], [ 6, 8]]) ● Numpy 데이터 모양을 확인하는법 x >>> array([1, 3, 2, 8, 4]) x.shape >>> (5,) # 데이터를 5개 저장하고 있다라는 뜻 ● Numpy 데이터 타입을 확인하는법 x.dtype >>> dtype('int32') # 32는 32비트라는 뜻 ● Numpy 데이터 갯..