C++之打造my vector篇

禁默 2024-09-13 12:05:05 阅读 69

目录

前言

1.参照官版,打造vector的基本框架

2.丰富框架,实现接口方法

基本的迭代器实现

数据的[]访问

容量和数据空间的改变

vector空间大小的返回与判空

数据的增删

数据打印

拷贝构造和赋值重载

3.扩展延伸,深度理解代码

迭代器失效问题

使用memcpy的拷贝问题

结束语


前言

前面章节我们讲解了vector相关接口,方法的使用,本节内容我们将自己创造vector,模仿官方的接口方法。

1.参照官版,打造vector的基本框架

通过查看官方文档我们知道,vector是个可以变化的数组,是个容器,可以储存一系列数据,

是典型的模版类。

且有三个基本成员start,finish,end_of_storage,我们可以理解为指向数组的开端,数据的结尾,以及容量的结束指针。

上图为插入成员后的分布情况。

故创造了一下的基本框架,因为是我们自己的实现,所以定义了一个my_vector的命名空间,

<code>namespace my_vector {

template<class T>

class vector {

public:

typedef T* iterator;

typedef const T* const_iterator;

vector()

{}

~vector() {

if (_start) {

delete[]_start;

_start = _finish = _end_of_storage = nullptr;

}

}

private:

iterator _start = nullptr;

iterator _finish=nullptr;

iterator _end_of_storage=nullptr;

};

这里我们采用初始化列表来进行默认构造,直接使用私有成员的缺省值,较为简便。

C++11前置生成默认构造

vector()=default;

2.丰富框架,实现接口方法

基本的迭代器实现

iterator begin() {

return _start;

}

iterator end() {

return _finish;

}

const_iterator begin()const {

return _start;

}

const_iterator end() const{

return _finish;

}

就是比较简单的返回开始和结束的指针。

数据的[]访问

T& operator[](size_t i) {

assert(i < size());

return _start[i];

}

const T& operator[](size_t i) const

{

assert(i < size());

return _start[i];

}

顾名思义就是相似于数组的下标访问

容量和数据空间的改变

void reserve(size_t n) {

if (n > capacity()) {

size_t oldsize = size();

T* temp = new T[n];

memcpy(tmp, _start, old_size * sizeof(T));

/*

for (size_t i = 0; i < oldsize; i++) {

temp[i] = _start[i];

}

*/

delete[]_start;

_start = temp;

_finish =temp + oldsize;

_end_of_storage = temp+n;

}

}

对于扩容操作,我们创建了一个新的数组,然后定义一个oldsize来存储以前的数据空间,来确定之后的_finish位置,因为我们在之前释放了原来的数组了,如果不想这样操作,不想定义一个oldsize,就要把delete操作放在_finish=temp+size()之后。

这里用了memcpy函数来转移数据,但是我们会发现有一个小小的问题,当数据类型为string时,程序会崩溃,这个后续会讲解的。

void resize(size_t n, T val = T())

{

if (n < size())

{

_finish = _start + n;

}

else

{

reserve(n);

while (_finish < _start + n)

{

*_finish = val;

++_finish;

}

}

}

resize函数的作用是调整容器的大小,使其能够容纳n个元素。如果n小于当前容器的大小,则容器会被截断;如果n大于当前容器的大小,则容器会被扩展,并且新增的元素会被初始化为val的值。

T val = T():表示一个默认参数,它是容器的元素类型T的默认构造函数生成的对象。如果调用resize时没有指定这个参数,就会使用元素类型的默认值。

如果n小于当前容器的大小

_finish = _start + n;:这条语句会截断容器,使其大小变为n。这里_start是指向容器第一个元素的指针,_finish是指向容器最后一个元素的下一个位置的指针。通过将`_finish`向前移动到_start + n的位置,容器的大小就被减少了。

 如果`n`大于或等于当前容器的大小

- reserve(n);:调用reserve函数确保容器的容量至少为n。如果当前容量小于n,reserve会重新分配内存以容纳至少n个元素。

- 默认构造函数`T()`必须存在,以便能够为新元素提供默认值。如果`T`没有默认构造函数,则这段代码在尝试使用默认参数时会出错。

vector空间大小的返回与判空

size_t size()const {

return _finish - _start;

}

size_t capacity()const {

return _end_of_storage - _start;

}

bool empty()const {

return _start == _finish;

}

大小返回就是几个指针加减即可

数据的增删

对于数据的增删,模拟尾插,尾删,指定位置的插入,删除(后两者都与迭代器iterator相结合)

void push_back(const T& x) {

if (_finish == _end_of_storage) {

reserve(capacity() == 0 ? 4 : capacity() * 2);

}

*_finish = x;

++_finish;

}

void pop_back() {

assert(!empty());

--_finish;

}

void erase(iterator pos) {

assert(pos >= _start);

assert(pos <= _finish);

iterator it = pos + 1;

while (it != end()) {

*(it - 1) = *it;

it++;

}

_finish--;

}

iterator insert(iterator pos,const T&x) {

assert(pos >= _start && pos<=_finish);

if (_finish == _end_of_storage) {

size_t len = pos - _start;

reserve(capacity() == 0 ? 4 : capacity() * 2);

pos = _start + len;

}

iterator end = _finish + 1;

while (end > pos) {

*end = *(end - 1);

end--;

}

*pos = x;

_finish++;

return pos;

}

对于插入数据的操作都要进行扩容的判断操作,对于数据的挪动我们可以采用依次赋值,就像代码中的*end=*(end-1);end--//*(it-1)=*it;it++;

通过画图可以更加清楚的理解。

数据打印

template<class T>

void print_vector(const vector<T>& v) {

//typename vector<T>::const_iterator it = v.begin();

auto it = v.begin();

while (it != v.end()) {

cout << *it << " ";

it++;

}

cout << '\n';

for (auto e:v) {

cout << e << " ";

}

cout << endl;

}

template<class Container>

void print_container(const Container& v) {

auto it = v.begin();

while (it != v.end()) {

cout << *it << " ";

it++;

}

cout << '\n';

for (auto e : v) {

cout << e << " ";

}

cout << endl;

}

规定,没有实例化的类模板里面取东西,编译器不能区分这里const_iterator是类型还是静态成员变量,所以在注释的部分我们看见前面加了个typename.

//typename vector<T>::const_iterator it = v.begin();

print_vector 函数专门用于打印 std::vector<T> 类型的容器。

print_container 函数是一个更通用的模板函数,可以用于打印任何符合容器概念的类型。

 

void vector5()

{

vector<string> v;

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

print_container(v);

v.push_back("11111111111111111111");

print_container(v);

}

拷贝构造和赋值重载

vector(const vector<T>& v) {

reserve(v.size());

for (auto e : v) {

push_back(e);

}

}

vector<T>operator=(const vector<T>& v) {

if (this != v) {

reserve(v.size());

for (auto e : v) {

push_back(e);

}

}

return this;

}

这一种思路是开设新空间,然后将数据一个个尾插到创建的对象中。

void swap(vector<T>& v)

{

std::swap(_start, v._start);

std::swap(_finish, v._finish);

std::swap(_end_of_storage, v._end_of_storage);

}

// v1 = v3

//vector& operator=(vector v)

vector<T>& operator=(vector<T> v)

{

swap(v);

return *this;

}

这种思路是交换的方式,通过调用官方库中的函数,指针交换,将v的地址给了创建的对象。

template <class InputIterator>

vector(InputIterator first, InputIterator last) {

while (first != last) {

push_back(*first);

first++;

}

}

通过传需要拷贝的对象的数据范围给新对象(迭代器区间),是个函数模版,可以用任意的迭代器初始化,类型匹配即可 。

模板构造函数,用于构造一个std::vector,该构造函数接受两个迭代器firstlast,它们定义了要复制到新vector中的元素的范围。

3.扩展延伸,深度理解代码

在VS环境下,比较严格,在迭代器方面比较严格,特别是失效迭代器的访问。

迭代器失效问题

在测试接口的过程中,有个bug就是迭代器失效问题

我们知道迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*

因此迭代器失效,实际就是迭代器 底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即 如果继续使用已经失效的迭代器,程序可能会崩溃)。

1.对vector进行扩容操作,像resize,reserve等操作

还有就是在insert,push_back操作过程中涉及了扩容

#include <iostream>

using namespace std;

#include <vector>

int main()

{

vector<int> v{ 1,2,3,4,5,6 };

auto it = v.begin();

// 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容

// v.resize(100, 8);

// reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容

//量改变

v.reserve(100);

// 插入元素期间,可能会引起扩容,而导致原空间被释放

v.insert(v.begin(), 0);

v.push_back(8);

// 给vector重新赋值,可能会引起底层容量改变

//v.assign(100, 8);

/*

出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释

放掉,而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块

已经被释放的空间,而引起代码运行时崩溃。

解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给

it重新赋值即可。

*/

while (it != v.end())

{

cout << *it << " ";

++it;

}

cout << endl;

return 0;

}

修改后的代码 

#include <iostream>

#include <vector>

using namespace std;

int main()

{

vector<int> v{ 1,2,3,4,5,6 };

// 在修改vector之后,重新获取迭代器

auto it = v.begin();

v.reserve(100);

v.insert(v.begin(), 0);

v.push_back(8);

// 如果使用v.assign(100, 8);,也需要在之后重新获取迭代器

// 重新获取迭代器,因为之前的操作可能会改变vector的内存

it = v.begin();

while (it != v.end())

{

cout << *it << " ";

++it;

}

cout << endl;

return 0;

}

还有一点就是insert数据过后,即使没有扩容,指向容器中插入点之后的所有迭代器、指针和引用都可能失效。

所以当我们继续访问修改p的位置数据,已经失效了,需要更新失效的迭代器。

由于数据挪动,p的指向改变了,所以我们认为迭代器也失效了。

v.insert(p, 40);

p=v.insert(p, 40);

(*(p+1)) *= 10; 

 2.erase的删除导致的迭代器失效问题

void test_vector3()

{

std::vector<int> v;

v.push_back(1);

v.push_back(2);

v.push_back(3);

v.push_back(4);

print_container(v);

// 删除所有的偶数

auto it = v.begin();

while (it != v.end())

{

if (*it % 2 == 0)

{

v.erase(it);

}

else

{

++it;

}

}

print_container(v);

}

}

当我们用VS std中的接口时,会发现直接报错

所以我们也要进行重新的更新

it=v.erase(it); 

<code>#include <iostream>

using namespace std;

#include <vector>

int main()

{

int a[] = { 1, 2, 3, 4 };

vector<int> v(a, a + sizeof(a) / sizeof(int));

// 使用find查找3所在位置的iterator

vector<int>::iterator pos = find(v.begin(), v.end(), 3);

// 删除pos位置的数据,导致pos迭代器失效。

v.erase(pos);

cout << *pos << endl; // 此处会导致非法访问

return 0;

}

使用memcpy的拷贝问题

当我们想拷贝几个字符串时,就会出现问题了。

 问题分析:

1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。

2. 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

void reserve(size_t n) {

if (n > capacity()) {

size_t oldsize = size();

T* temp = new T[n];

memcpy(tmp, _start, old_size * sizeof(T));

/*

for (size_t i = 0; i < oldsize; i++) {

temp[i] = _start[i];

}

*/

delete[]_start;

_start = temp;

_finish =temp + oldsize;

_end_of_storage = temp+n;

}

}

当我们使用这个memcpy版本进行扩容插入时,程序会出现问题

测试代码

void vector5() {

vector<string> v;

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

print_container(v);

v.push_back("11111111111111111111");

print_container(v);

}

memcpy是浅拷贝,temp和原来的v指向了同一块空间,当调用了delete[]时,11111111...字符串被析构了,空间释放,变成随机值,后面又delete,free _start ,这时候temp指向的是释放的空间。

所以我们可以调用赋值,就可以解决问题,本质调用string的赋值,其他类型赋值一样的。

旧空间释放就不会影响新空间。

for (size_t i = 0; i < oldsize; i++) {

            temp[i] = _start[i];

4.完整代码复现

<code>#pragma once

#include <iostream>

#include <assert.h>

#include <vector>

#include <string>

using namespace std;

namespace my_vector {

template<class T>

class vector {

public:

typedef T* iterator;

typedef const T* const_iterator;

vector()

{}

vector(const vector<T>& v) {

reserve(v.size());

for (auto e : v) {

push_back(e);

}

}

/*

vector<T>operator=(const vector<T>& v) {

if (this != v) {

reserve(v.size());

for (auto e : v) {

push_back(e);

}

}

return this;

}

*/

template <class InputIterator>

vector(InputIterator first, InputIterator last) {

while (first != last) {

push_back(*first);

first++;

}

}

void swap(vector<T>& v)

{

std::swap(_start, v._start);

std::swap(_finish, v._finish);

std::swap(_end_of_storage, v._end_of_storage);

}

// v1 = v3

//vector& operator=(vector v)

vector<T>& operator=(vector<T> v)

{

swap(v);

return *this;

}

void clear() {

_finish = _start;

}

~vector() {

if (_start) {

delete[]_start;

_start = _finish = _end_of_storage = nullptr;

}

}

iterator begin() {

return _start;

}

iterator end() {

return _finish;

}

const_iterator begin()const {

return _start;

}

const_iterator end() const {

return _finish;

}

void reserve(size_t n) {

if (n > capacity()) {

size_t oldsize = size();

T* temp = new T[n];

memcpy(temp, _start, oldsize*sizeof(T));

/*

for (size_t i = 0; i < oldsize; i++) {

temp[i] = _start[i];

}

*/

delete[]_start;

_start = temp;

_finish = temp + oldsize;

_end_of_storage = temp + n;

}

}

void resize(size_t n, T val = T()) {

if (n < size()) {

_finish = _start + n;

}

else {

reserve(n);

while (_finish < _start + n) {

*_finish = val;

_finish++;

}

}

}

void push_back(const T& x) {

if (_finish == _end_of_storage) {

reserve(capacity() == 0 ? 4 : capacity() * 2);

}

*_finish = x;

++_finish;

}

void pop_back() {

assert(!empty());

--_finish;

}

void erase(iterator pos) {

assert(pos >= _start);

assert(pos <= _finish);

iterator it = pos + 1;

while (it != end()) {

*(it - 1) = *it;

it++;

}

_finish--;

}

iterator insert(iterator pos, const T& x) {

assert(pos >= _start && pos <= _finish);

if (_finish == _end_of_storage) {

size_t len = pos - _start;

reserve(capacity() == 0 ? 4 : capacity() * 2);

pos = _start + len;

}

iterator end = _finish + 1;

while (end > pos) {

*end = *(end - 1);

end--;

}

*pos = x;

_finish++;

return pos;

}

size_t size()const {

return _finish - _start;

}

size_t capacity()const {

return _end_of_storage - _start;

}

bool empty()const {

return _start == _finish;

}

T& operator[](size_t i) {

assert(i < size());

return _start[i];

}

const T& operator[](size_t i) const

{

assert(i < size());

return _start[i];

}

private:

iterator _start = nullptr;

iterator _finish = nullptr;

iterator _end_of_storage = nullptr;

};

template<class T>

void print_vector(const vector<T>& v) {

//typename vector<T>::const_iterator it = v.begin();

auto it = v.begin();

while (it != v.end()) {

cout << *it << " ";

it++;

}

cout << '\n';

for (auto e : v) {

cout << e << " ";

}

cout << endl;

}

template<class Container>

void print_container(const Container& v) {

/*

auto it = v.begin();

while (it != v.end()) {

cout << *it << " ";

it++;

}

cout << '\n';

*/

for (auto e : v) {

cout << e << " ";

}

cout << endl;

}

void vector1() {

vector<int>v;

v.push_back(1);

v.push_back(2);

v.push_back(3);

v.push_back(4);

v.push_back(5);

v.push_back(6);

int x;

cin >> x;

auto p = find(v.begin(), v.end(), x);

if (p != v.end()) {

p = v.insert(p, 40);

(*(p + 1)) *= 10;

}

//v.pop_back();

//v.pop_back();

//v.insert(v.begin() + 2, 5);

//v.erase(v.begin() + 3);

for (size_t i = 0; i < v.size(); i++) {

cout << v[i] << endl;

}

}

void vector2() {

vector<int>v;

v.push_back(1);

v.push_back(2);

v.push_back(3);

v.push_back(4);

v.push_back(5);

v.push_back(6);

print_vector(v);

vector<int>v1(v);

vector <int>v2 = v;

vector<int> v3(v1.begin(), v1.begin() + 3);

print_container(v1);

print_container(v2);

print_container(v3);

/*

vector<double>v1;

v1.push_back(1.1);

v1.push_back(2.2);

v1.push_back(3.3);

v1.push_back(4.4);

v1.push_back(5.5);

v1.push_back(6.6);

print_container(v1);

*/

}

void vector3() {

vector<int> v;

v.resize(10, 1);

v.reserve(20);

print_container(v);

cout << v.size() << endl;

cout << v.capacity() << endl;

v.resize(15, 2);

print_container(v);

v.resize(25, 3);

print_container(v);

v.resize(5);

print_container(v);

}

void vector4() {

vector<int> v;

v.push_back(1);

v.push_back(2);

v.push_back(3);

v.push_back(4);

v.push_back(4);

v.push_back(5);

print_container(v);

// 删除所有的偶数

auto it = v.begin();

while (it != v.end())

{

if (*it % 2 == 0)

{

v.erase(it);

}

else {//不加else,不会删除连续的偶数,会++两次

++it;

}

}

print_container(v);

}

void test_vector3()

{

std::vector<int> v;

v.push_back(1);

v.push_back(2);

v.push_back(3);

v.push_back(4);

print_container(v);

// 删除所有的偶数

auto it = v.begin();

while (it != v.end())

{

if (*it % 2 == 0)

{

it=v.erase(it);

}

else

{

++it;

}

}

print_container(v);

}

void vector5() {

vector<string> v;

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

v.push_back("11111111111111111111");

print_container(v);

v.push_back("11111111111111111111");

print_container(v);

}

}

结束语

本期博客就到此结束啦,相信通过自己对vector的实现,大家对vector有了更深的了解。

最后希望友友们给小编点点赞吧,感谢各位友友的支持!!! 



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。