jupyter notebook or colab 환경에서 사용할수있는 동적 시각화 패키지(?) 사용
인터랙션 시각화 1편은 plotly를 사용한 인터랙션 시각화로 구성되어있습니다
1. 선형회귀 + 산포도
import plotly.express as px
df = px.data.tips()
fig = px.scatter(df, x="total_bill", y="tip", trendline="ols")
fig.show()
express를 사용한 데이터, 결제금과 팁 간의 선형회귀 + 산점도(산포도)
기본적이지만 데이터의 구조를 파악하는데 도움이 많이 되는 시각화 방법입니다
2. gapminder data 분포도
import plotly.express as px
df = px.data.gapminder().query("year == 2007").query("continent == 'Europe'")
df.loc[df['pop'] < 2.e6, 'country'] = 'Other countries' # Represent only large countries
fig = px.pie(df, values='pop', names='country', title='Population of European continent')
fig.show()
유럽 인구 분포도
3. pie 분포
import plotly.express as px
df = px.data.tips()
fig = px.pie(df, values='tip', names='day', color_discrete_sequence=px.colors.sequential.RdBu)
fig.show()
4. go pie 분포 pull
import plotly.graph_objects as go
labels = ['a','b','c','d']
values = [4500, 2500, 1053, 500]
fig = go.Figure(data=[go.Pie(labels=labels, values=values, pull=[0, 0, 0.2, 0])])
fig.show()
5. distplot
import plotly.figure_factory as ff
import numpy as np
# Add histogram data
x1 = np.random.randn(200) - 2
x2 = np.random.randn(200)
x3 = np.random.randn(200) + 2
x4 = np.random.randn(200) + 4
# Group data together
hist_data = [x1, x2, x3, x4]
group_labels = ['Group 1', 'Group 2', 'Group 3', 'Group 4']
# Create distplot with custom bin_size
fig = ff.create_distplot(hist_data, group_labels, bin_size=.2)
fig.show()
6. Box plot
import plotly.express as px
df = px.data.tips()
fig = px.box(df, x="day", y="total_bill", color="smoker")
fig.show()
개인적으로 박스 플롯이 데이터 분석에 도움이 많이 되는 시각화 그래프라고 생각해요 예외 데이터 확인과 핵심데이터 구간 확인이 동시에 되는 효율적인 시각화 입니다 *_*
7. histgram
import plotly.express as px
df = px.data.tips()
fig = px.density_heatmap(df, x="total_bill", y="tip", marginal_x="histogram", marginal_y="histogram")
fig.show()
'Python > 데이터 분석' 카테고리의 다른 글
데이터분석 자동처리 pandas-profiling (0) | 2024.02.14 |
---|---|
데이터 분석 텍스트 마이닝 정규표현식 python [2편] (0) | 2024.02.06 |
데이터 분석 텍스트 마이닝 정규표현식 python [1편] (0) | 2024.02.02 |
데이터 분석 텍스트 마이닝 예제 nsmc (0) | 2024.01.30 |
데이터 분석 matplotlib, seaborn 시각화 (0) | 2024.01.30 |