使用 Boost 实现线程同步队列
使用 STL 和 boost 实现线程同步队列。
引言
目前我正在做一个网络通信项目,并尝试使用 C++ STL 和 boost 进行开发。在开发多线程程序时,同步是一个重要的问题。如果你的程序需要处理流式数据包,那么维护一个队列是个好主意。
背景
这是我第一次使用 boost,由于缺乏好的例子,它并不容易使用。 你可以在 https://boost.ac.cn/ 找到 boost 库和文档。 这是使用 boost 的优势,摘自其网站
总而言之,是生产力。 使用像 Boost 这样高质量的库可以加速初始开发,减少错误,减少重复发明轮子,并降低长期维护成本。 并且由于 Boost 库往往会成为事实上的或法律上的标准,因此许多程序员已经熟悉它们。
在这个例子中,我只使用了 boost 同步类,但是所有函数都可以用 boost 重写,并且可以用于跨平台开发。 boost 同步类看起来很简单,但作为初学者,我仍然犯了一些错误,所以我开发了一个测试项目来验证它的功能。 在了解如何使用它之后,它将帮助你简化代码并减少错误。
使用代码
在这个例子中,我将线程同步模型实现为生产者-消费者。 生产者线程创建数据并将其插入到队列中,而消费者线程使用数据并从队列中删除数据。 我使用互斥对象来保持两个线程同步。
我正在尝试使用不同的方法来解决同一个问题,然后比较它们的优缺点。
首先,我设计了一个接口来抽象同步队列模型。 ISynchronizedQueue
抽象类只有两个方法:add()
和 get()
。 add()
将在生产者线程中使用,以将数据插入到队列中,而 get()
将在消费者线程中使用,以获取和删除队列中的数据。 该接口有三种不同的实现方式。
SynchronizedDequeue
:是一个双端队列,使用 STL deque 实现。SychronizedVector
:是一个环或循环队列,使用 STL vector 实现。SychronizedVectorNB
:是SychronizedVector
的非阻塞版本。
这是头文件和接口定义:
#include <iostream>
#include <deque>
#include <boost/thread.hpp>
#include <boost/thread/mutex.hpp>
#include <boost/thread/condition.hpp>
using namespace std;
#define default_packesize 1280
class TPacket
{
int my_size;
unsigned char my_databuf[default_packesize];
unsigned int ID;
public:
TPacket() {std::memset(my_databuf,0,sizeof(my_databuf));my_size=0;}
~TPacket() {;}
int GetSize() {return my_size;}
void SetSize(int size) {my_size = size;}
unsigned int GetID() {return ID;}
void SetID(int id) {ID = id;}
bool GetData(char* pbuf,int& size)
{
if(my_size>size)
return false;
size = my_size;
memcpy(pbuf,my_databuf,my_size);
return true;
}
bool SetData(char* pbuf,int size)
{
if(size>default_packesize)
return false;
memcpy(my_databuf,pbuf,size);
my_size=size;
return true;
}
public:
virtual bool IsValid() {return false;}
virtual bool Encode() {return false;}
virtual bool Decode() {return false;}
};
//queue interface
template <class T>
class ISynchronizedQueue
{
public:
virtual bool add(T pkt) = 0;
virtual bool get(T& pkt) = 0;
virtual bool read(T& pkt) = 0;
virtual bool del(T& pkt) = 0;
virtual bool clear() = 0;
};
让我们看看这些实现。
class SynchronizedDequeue: public ISynchronizedQueue<TPacket>
{
boost::mutex m_mutex;
deque<TPacket> m_queue;
boost::condition_variable m_cond;
public:
bool add(TPacket pkt)
{
boost::lock_guard<boost::mutex> lock(m_mutex);
if(m_queue.size()>100)
m_queue.clear();
m_queue.push_back(pkt);
return true;
}
bool get(TPacket& pkt)
{
boost::lock_guard<boost::mutex> lock(m_mutex);
if (!m_queue.size())
{
return false;
}
pkt = m_queue.front();
m_queue.pop_front();
return true;
}
bool read(TPacket& pkt)
{
boost::lock_guard<boost::mutex> lock(m_mutex);
if (!m_queue.size())
{
return false;
}
pkt = m_queue.front();
return true;
}
bool del(TPacket& pkt)
{
return get(pkt);
}
bool clear()
{
boost::lock_guard<boost::mutex> lock(m_mutex);
m_queue.clear();
return true;
}
};
SynchronizedDequeue
具有动态队列大小。 优点是如果生产者比消费者快,则不会丢失任何数据,所有生成的数据都将由消费者处理。 缺点是它对内存管理性能有更大的影响。 当数据包插入队列时,它会分配内存,并在我们将数据返回给消费者线程时释放内存。 由于会多次进行内存分配和释放,这可能会减慢同一进程中较大对象的内存回收速度。
class SynchronizedVector :public ISynchronizedQueue<TPacket>
{
int queue_size;
boost::mutex m_mutex;
std::vector<TPacket> my_vector;
int start,end;
public:
SynchronizedVector(int q_size=100) {queue_size = q_size; start=end=0; my_vector.assign(queue_size,TPacket());}
bool add(TPacket pkt)
{
boost::lock_guard<boost::mutex> lock(m_mutex);
my_vector[end++] = pkt;
if(end>=queue_size)
end = 0;
if(end == start)
start = end+1;
if(start>=queue_size)
start = 0;
return true;
}
bool get(TPacket& pkt)
{
boost::lock_guard<boost::mutex> lock(m_mutex);
if(start==end)
return false;
pkt = my_vector[start++];
if(start>=queue_size)
start = 0;
return true;
}
bool read(TPacket& pkt) //not support
{
return false;
}
bool del(TPacket& pkt) //not support
{
return false;
}
bool clear()
{
boost::lock_guard<boost::mutex> lock(m_mutex);
start = end =0;
return true;
}
};
SychronizedVector
使用固定大小的队列来避免内存管理开销,但它会覆盖队列中未及时处理的旧数据,同时新数据会进来并将其冲掉。
class SynchronizedVectorNB :public ISynchronizedQueue<TPacket>
{
int queue_size;
boost::mutex m_mutex;
std::vector<TPacket> my_vector;
int start,end;
public:
SynchronizedVectorNB(int q_size=100) {queue_size = q_size; start=end=0; my_vector.assign(queue_size,TPacket());}
bool add(TPacket pkt)
{
boost::unique_lock<boost::mutex> lock(m_mutex,boost::try_to_lock_t());
if(!lock.owns_lock())
return false;
my_vector[end++] = pkt;
if(end>=queue_size)
end = 0;
if(end == start)
start = end+1;
if(start>=queue_size)
start = 0;
return true;
}
bool get(TPacket& pkt)
{
boost::unique_lock<boost::mutex> lock(m_mutex,boost::try_to_lock_t());
if(!lock.owns_lock())
return false;
if(start==end)
return false;
pkt = my_vector[start++];
if(start>=queue_size)
start = 0;
return true;
}
bool read(TPacket& pkt) //not support
{
return false;
}
bool del(TPacket& pkt) //not support
{
return false;
}
bool clear()
{
boost::lock_guard<boost::mutex> lock(m_mutex);
start = end =0;
return true;
}
};
SychronizedVectorNB
不会被生产者或消费者线程阻塞。 优点是,如果在队列访问线程的同一循环中需要完成其他一些活动,则非阻塞版本将保证响应时间。
上面的两个队列在线程尝试拥有互斥对象时可能会阻塞线程。 如果一个线程拥有互斥锁,然后发生一些异常,则另一个线程也会被阻塞。 它的缺点是,当它无法获得锁时,它可能无法将数据添加到队列中,然后调用者需要再次添加相同的数据。
这是生产者线程的示例代码
DWORD WINAPI ProducerServerThread(LPVOID lpParam)
{
int count=0;
ISynchronizedQueue<TPacket>* pQ = (ISynchronizedQueue<TPacket>*)lpParam;
TPacket pkt;
LOG("\n-------------------------Producer thread begin-----------------------");
while(1)
{
DWORD t1 = GetTickCount();
Sleep(50);
if(count++>=1000)
break;
//initialize packet data to zero.
memset(&pkt,0,sizeof(pkt));
//add content to packet, I only set the ID here, you can do something more.
pkt.SetID(count);
if(pQ->add(pkt))
LOG("Add PACKET ID = %d ",pkt.GetID());
else
LOG("Add Packet Failed");
DWORD t2 = GetTickCount();
LOG("ONE-LOOP DURATION = %d",t2-t1);
}
LOG("\n-------------------------Producer thread end-----------------------");
return 0;
}
这是消费者线程的示例代码
DWORD WINAPI ConsumerServerThread(LPVOID lpParam)
{
int count=0;
ISynchronizedQueue<TPacket>* pQ = (ISynchronizedQueue<TPacket>*)lpParam;
TPacket pkt;
LOG("\n-------------------------Cosumer thread begin-----------------------");
while(1)
{
Sleep(10);
if(count++>=1200)
break;
if(pQ->get(pkt))
LOG("Get Packet ID = %d",pkt.GetID());
else
LOG("Get Packet Failed");
}
LOG("\n-------------------------Cosumer thread end-----------------------");
return 0;
}
这是主线程的示例代码
SynchronizedDequeue m_q[5];
//SynchronizedVector m_q[5];
//SynchronizedVectorNB m_q[5]
int _tmain(int argc, _TCHAR* argv[])
{
int thread_count =5;
HANDLE server_threads[10];
for (int i=0; i < thread_count ;i++)
{
server_threads[i] = CreateThread(
NULL,
0,
ProducerServerThread,
&m_q[i],
0,
NULL
);
if (server_threads[i] == NULL)
{
LOG( "Create Thread failed: %d\n", GetLastError());
return 0;
}
}
for (int i= 0; i < thread_count ;i++)
{
server_threads[i+thread_count] = CreateThread(
NULL,
0,
ConsumerServerThread,
&m_q[i],
0,
NULL
);
if (server_threads[i] == NULL)
{
LOG( "Create Thread failed: %d\n", GetLastError());
return 0;
}
}
// Wait until the threads exit, then cleanup
int retval = WaitForMultipleObjects(
2*thread_count,
server_threads,
TRUE,
INFINITE
);
if ((retval == WAIT_FAILED) || (retval == WAIT_TIMEOUT))
{
LOG( "WaitForMultipleObjects failed: %d\n", GetLastError());
return 0;
}
}
在测试代码中,我创建了五个生产者、五个消费者和五个队列。 每个生产者都有与其关联的消费者,它们使用相同的队列。 你可以通过数据包 ID 验证每个生成的数据包是否由消费者线程按顺序处理。 你可以自己定义 LOG 宏,我使用了一个线程安全的 LOG 宏,带有日志时间输出。 通过日志时间,你可以更清楚地看到线程性能。
19:33:50:106 5972 info: ConsumerServerThread: Get Packet Failed
19:33:50:106 4244 info: ConsumerServerThread: Get Packet Failed
19:33:50:122 5808 info: ConsumerServerThread: Get Packet Failed
19:33:50:122 8464 info: ConsumerServerThread: Get Packet Failed
19:33:50:122 7760 info: ProducerServerThread: Add PACKET ID = 1
19:33:50:122 7416 info: ConsumerServerThread: Get Packet ID = 1
19:33:50:122 7760 info: ProducerServerThread: ONE-LOOP DURATION = 63
19:33:50:138 5808 info: ConsumerServerThread: Get Packet Failed
19:33:50:138 5972 info: ConsumerServerThread: Get Packet Failed
19:33:50:138 8464 info: ConsumerServerThread: Get Packet Failed
19:33:50:138 4244 info: ConsumerServerThread: Get Packet Failed
19:33:50:138 8268 info: ProducerServerThread: Add PACKET ID = 1
19:33:50:138 7416 info: ConsumerServerThread: Get Packet Failed
19:33:50:138 8268 info: ProducerServerThread: ONE-LOOP DURATION = 62
19:33:50:153 4244 info: ConsumerServerThread: Get Packet ID = 1
19:33:50:153 5808 info: ConsumerServerThread: Get Packet Failed
19:33:50:153 8836 info: ProducerServerThread: Add PACKET ID = 1
19:33:50:153 7352 info: ProducerServerThread: Add PACKET ID = 1
19:33:50:153 8464 info: ConsumerServerThread: Get Packet Failed
19:33:50:153 5972 info: ConsumerServerThread: Get Packet ID = 1
19:33:50:153 8836 info: ProducerServerThread: ONE-LOOP DURATION = 63
19:33:50:153 7352 info: ProducerServerThread: ONE-LOOP DURATION = 63
在测试了具有 5 个生产者-消费者线程对的三种不同同步队列,每个线程添加和获取 1000 个数据包之后,它们的性能基本相同。 日志本身将花费大约 10 毫秒。 你可以修改它,以查看这三种类型的队列在更大的数据集、更长的运行时间或更大的对象内存分配中的表现。
关注点
第一次使用 C++ boost 库的一小部分真是太有趣了。
历史
- 第一个版本,08/17/2012。
- 第二个版本,08/19/2012:更新文章,提供更多说明。
- 第三个版本,10/28/2014:更新代码以支持模板。