問題現象
文件存儲 NAS(File Storage NAS)為多客戶端提供了統一名字空間的文件共享讀寫能力,但在多進程/多客戶端并發寫同一個文件的場景中(典型的例如并發寫同一個日志文件),各進程分別維護了獨立的文件描述符及寫入位置等上下文信息,而NFS協議本身并沒有提供Atomic Append語義的支持,因此可能會出現寫覆蓋、交叉、串行等異常現象。
解決方案
(推薦)不同進程/客戶端寫入同一文件系統的不同文件中,后續分析處理時再進行歸并,這個方案能夠很好地解決并發寫入導致的問題,同時無需使用文件鎖,不會對性能造成影響。
對于并發追加寫同一個文件(如日志)的場景,可以使用文件鎖+seek機制來保證寫入的原子性和一致性。但是文件鎖+seek是一個比較耗時的操作,可能會對性能產生顯著的影響。下面將對這種方式進行簡單介紹,以供參考。
flock+seek使用方法
由于NFS協議本身沒有提供對Atomic Append語義的支持,因此當并發寫入同一文件末尾(如日志)時,很可能會出現相互覆蓋的情況。在Linux中,通過使用flock+seek的方式,可以在NFS文件系統上做到模擬Atomic Append,對并發追加寫入同一文件提供保護和支持。
使用方式如下:
調用fd=open(filename, O_WRONLY | O_APPEND | O_DIRECT) 以追加寫的方式打開文件,并且指定O_DIRECT(直寫,不通過Page Cache),獲得文件描述符fd。
調用flock(fd, LOCK_EX|LOCK_NB) 嘗試獲取文件鎖,如果獲取失敗(如鎖已被占用)則會返回錯誤,此時可以繼續重試或進行錯誤處理。
文件鎖獲取成功后,調用lseek(fd, 0, SEEK_END) 將fd當前的寫入偏移定位到文件末尾。
執行正常的寫操作,此時寫入位置應該是文件的末尾,并且由于有文件鎖的保護,不會出現并發寫入相互覆蓋的問題。
寫操作執行完成后,調用flock(fd, LOCK_UN) 釋放文件鎖。
下面是一個簡單的C語言示例程序:
#define _GNU_SOURCE
#include<stdlib.h>
#include<stdio.h>
#include<fcntl.h>
#include<string.h>
#include<unistd.h>
#include<sys/file.h>
#include<time.h>
const char *OUTPUT_FILE = "/mnt/blog";
int WRITE_COUNT = 50000;
int do_lock(int fd)
{
int ret = -1;
while (1)
{
ret = flock(fd, LOCK_EX | LOCK_NB);
if (ret == 0)
{
break;
}
usleep((rand() % 10) * 1000);
}
return ret;
}
int do_unlock(int fd)
{
return flock(fd, LOCK_UN);
}
int main()
{
int fd = open(OUTPUT_FILE, O_WRONLY | O_APPEND | O_DIRECT);
if (fd < 0)
{
printf("Error Open\n");
exit(-1);
}
for (int i = 0; i < WRITE_COUNT; ++i)
{
char *buf = "one line\n";
/* Lock file */
int ret = do_lock(fd);
if (ret != 0)
{
printf("Lock Error\n");
exit(-1);
}
/* Seek to the end */
ret = lseek(fd, 0, SEEK_END);
if (ret < 0)
{
printf("Seek Error\n");
exit(-1);
}
/* Write to file */
int n = write(fd, buf, strlen(buf));
if (n <= 0)
{
printf("Write Error\n");
exit(-1);
}
/* Unlock file */
ret = do_unlock(fd);
if (ret != 0)
{
printf("UnLock Error\n");
exit(-1);
}
}
return 0;
}
更詳細的flock()使用方式,請參見Linux file locking mechanisms - Flock, Lockf, and Fcntl。
在NAS文件系統上使用flock()需要您的Linux內核版本在2.6.12及以上,如果您的內核版本較低,請使用fcntl()調用。