worldcloud.WorlCloud()库 & matplotlib.pyplot.imshow()库

案例链接:怎么做中文wordcloud? 附:案例&代码

一、worldcloud.WoldCloud()库

· 官方文档链接点击打开链接

 · 翻译部分:

wordcloud.WordCloud(
    font_path=None,           
    width=400,
    height=200, 
    margin=2, 
    ranks_only=None,
    prefer_horizontal=0.9,
    mask=None,
    scale=1,
    color_func=None,
    max_words=200,
    min_font_size=4,
    stopwords=None,
    random_state=None,
    background_color='black',
    max_font_size=None,
    font_step=1,
    mode='RGB',
    relative_scaling=0.5,
    regexp=None,
    collocations=True,
    colormap=None,
    normalize_plurals=True )   

0. 常用参数:

– font_path:指明要用的字体的路径,

– width:默认值400。设定词云画布的宽度,

– height:默认值200。画布高度,

– mask:默认无。用来设定词云的形状,

– min_font_size:默认值4,整数类型。设定最小的词的尺寸/大小,

– max_font_size:默认无,整数型。设定最大词的大小,

– max_words:默认值200。设定词云最多显示的词的个数,

– background_color:默认值为黑色。设定词云画布底色,

– Scale:默认值1。值越大,图像密度越大越清晰:

– color_func:默认无,可选参数一个“callable”。collable可以返回每个词的PIL色彩值,包括大小/位置/方向/字体格式/随机起始位置。

1. 不常用参数

– stop_word:默认无。设定取词程序在某个词处停止,

– prefer_horizontal:默认值0.90,浮点数类型。表示在水平如果不合适,就旋转为垂直方向,水平放置的词数占0.9?,

– font_step:默认值1,整数型。对生成的词抽样,设定抽取的两个词之间略过的词的个数,

– mode:默认值“RGB”,字符串型。或者使用“RGBA”产生透明背景,

– relative_scaling:默认值0.5,浮点型。设定按词频倒序排列,上一个词相对下一位词的大小倍数。有如下取值:“0”表示大小标准只参考频率排名,“1”如果词频是2倍,大小也是2倍,

– regexp:默认无,字符串类型。至于作用,笔者还没搞懂,

– collocations默认为True,可选项为“bool”。决定词云是否可以包含两个词的搭配,

– colormap: srting or matplotlib colormap, default=’viridis’:如果“color_func”指定,则失效;否则由matplotlib的色彩库为每个词随机定颜色,

– normalize_plurals: bool, default=True:默认为True。默认True决定将词尾后缀‘s’删除。

 

二、matplotlib.pyplot.imshow()库

· 原文链接:点击打开链接

matplotlib.pyplot.imshow(
    X, 
    cmap=None, 
    norm=None, 
    aspect=None, 
    interplotation=None, 
    alpha=None, 
    Vmin=None, 
    vmax= None, 
    origin=None, 
    extent=None, 
    shape=None, 
    filternorm=1, 
    filterrad=4.0, 
    imlim=None, 
    resample=None,
    url=None, 
    hold=None, 
    data=None, **kwargs)

作用:将一个image显示在二维坐标轴上。

0. 常用参数

– X:array_like对象/数列类对象,shape(n,m) 或者(n,m,3)或者(n,m,4)

    把X代表的图片显示在当前坐标轴中。X可以是数列类格式、或者PIL图片。如果X是数列类对象,它可以有如下3种情况&类型: 

·  M*N – 用来作图的数列值float类型 / INT类型   

· M*N*3 – RGB数列float类型 / unit8类型 

· M*N*4 – RGBA数列float类型 /  unit8类型

M*N*3和M*N*4的float数列,取值范围限定为[0.0, 1.0]。M*N类数列是基于norm(采用标量对映射到标量方法作图)和cmap(将标准化标量映射为颜色)。

– interplotation:默认”None”,可用字符串类型命令设定

    可设定的字符串命令为:’none’,’nearest’,’bilinear‘,’bicubic’,‘spline16’, ‘spline36’, ‘hanning’, ‘hamming’, ‘hermite’, ‘kaiser’,’quadric’,’catrom’,’gaussian’,’bessel’,’mitchell’, ‘sinc’,’lanczos’

  • 如果”None”,默认rc image.interpolation
  • 如果是”none”,则在Agg,ps和pdf后端不进行插值。其他后端将会落到“最近”。

图例:没有使用插值算法 VS 使用(bilinear)差值算法:

1. 不常用参数:

– cmap:默认”None”,可设为 “colormap”

    如果是“None”,默认rc值符合 image.cmap 。如果X是3-D,则cmap会被忽略,而采用 具体的RGB(A)值。

– aspect:默认”None”,可设为[‘aotu’ / ‘equal’ / scalar]

    如果”None”,默认rc值符合image.aspect

    如果”auto”,则改变图片的横纵比、以便适应坐标轴的横纵比,

    如果”equal”,同时extent为”None”,则改变坐标轴的横纵比、以便适应图片的;如果extent不为”None”,则改变坐标轴的横纵比、以便适应与之匹配,

– norm:默认”None”,可设为 Normalize

    “Normalize(标准化)”,将2-D的X浮点值转化到[0, 1]区间,再作为cmap的输入值;如果norm是”None”,则使用默认功能:normilize(标准化)/ 如果norm是比如”NoNorm”,X必须是直接指向camp的查询表的整数数组,

– vmin,vmax:默认”None”,可用标量类型命令设定

    vminvmax和规范(norm)一起使用来规范(normlize)亮度数据。注:如果你忽略一个norm实例,你的vminvmax设定将会被忽略。

– alpha:默认”None”,可用标量型命令设定

    alpha混合值,介于0(透明)和1(不透明)之间

– origin:默认”None”,可选