- 网络数据采集技术:Java网络爬虫实战
- 钱洋等
- 408字
- 2025-02-17 21:43:45
2.3 数组
数组是指一组数据的集合,数组中每个数据称为元素或单元。声明数组包括数组类型以及数组名称,如声明一个int类型的一维数组。

声明数组只是给出了数组的类型以及数组名,要想使用数组,还需要使用new语句创建数组,并为数组分配内存,格式如下:
数组名 =new数据类型[数组元素个数]
例如:

数组分配空间后,可通过索引的方式初始化数组,索引从0开始,如上面的int类型数组索引到3为止。

数组通过索引符访问自身元素,如arr[0]、arr[1]等,索引从0开始。
上述数组的声明、创建和初始化是分开进行的,我们也可以同时进行这三个操作,例如:

另外,Java支持多维数组的使用,如Java编写文本处理算法时(如主题模型),经常使用二维数组。
再者,数组都有length属性,表示操作数组的长度,length属性只能读取不能修改,如输出某一数组的长度。

在Java网络爬虫中,经常涉及数组操作。如采集图片、PDF和压缩文件时,需要对byte(字节)类型的数组进行操作;使用split()方法对字符串类型数据进行分解时,涉及String数组的操作。