【问题标题】:Why scanf can read more than 1024 character while stdin stream buffer is 1024 bytes only?为什么 scanf 可以读取超过 1024 个字符,而 stdin 流缓冲区只有 1024 个字节?
【发布时间】:2019-07-27 16:54:37
【问题描述】:

我可以通过 APUE 中的代码获取在 Ubuntu 下连接我的终端的stdin 流缓冲区大小和缓冲区类型:

#include "apue.h" //It's merely a wrapper header

void    pr_stdio(const char *, FILE *);
int     is_unbuffered(FILE *);
int     is_linebuffered(FILE *);
int     buffer_size(FILE *);

int
main(void)
{
    FILE    *fp;

    fputs("enter any character\n", stdout);
    if (getchar() == EOF)
        err_sys("getchar error");
    fputs("one line to standard error\n", stderr);

    pr_stdio("stdin",  stdin);
    pr_stdio("stdout", stdout);
    pr_stdio("stderr", stderr);

    if ((fp = fopen("/etc/passwd", "r")) == NULL)
        err_sys("fopen error");
    if (getc(fp) == EOF)
        err_sys("getc error");
    pr_stdio("/etc/passwd", fp);
    exit(0);
}

void
pr_stdio(const char *name, FILE *fp)
{
    printf("stream = %s, ", name);
    if (is_unbuffered(fp))
        printf("unbuffered");
    else if (is_linebuffered(fp))
        printf("line buffered");
    else /* if neither of above */
        printf("fully buffered");
    printf(", buffer size = %d\n", buffer_size(fp));
}

int
is_unbuffered(FILE *fp)
{
    return(fp->_flags & _IO_UNBUFFERED);
}

int
is_linebuffered(FILE *fp)
{
    return(fp->_flags & _IO_LINE_BUF);
}

int
buffer_size(FILE *fp)
{
    return(fp->_IO_buf_end - fp->_IO_buf_base);
}

从我得到的终端运行上面的代码:stream = stdin, line buffered, buffer size = 1024


那我写一个测试:

#include "stdio.h"

int main(){
    char c[2048];
    c[1033] = 'a';
    scanf("%s", c); //I paste 1440 '1' into the terminal.
    printf("%c", c[1033]); //I expect it to be 'a'.
    return 0;
}

我将 1440(>1024 字节) 字符 '1' 粘贴到终端,并期望多余的输入数据会以某种方式被丢弃,因为行缓冲区大小仅为 1024 字节。但最终,我用c[1033] 打印了“1”。

为什么scanf 可以读取超过1024 个字符,而stdin 的缓冲区大小仅为1024B?

引自APUE

我们可以看到这个系统的默认设置是有标准输入和标准 当它们连接到终端时缓冲的输出线。行缓冲区为 1,024 字节。 请注意,这并不限制我们使用 1,024 字节的输入和输出行;那只是 缓冲区的大小。 将 2,048 字节的行写入标准输出将需要两个 编写系统调用。

或者我应该问怎么做?

我不太理解强调的文字。缓冲区不限制用户输入大小吗?为什么它说我可以输入超过缓冲区大小的数据(每个输入)?谁能告诉我它是如何工作的?

【问题讨论】:

  • scanf() 到达第一个缓冲区的末尾时,它会返回系统获取更多缓冲区。缓冲区只是一种便利和优化措施。
  • @JonathanLeffler 嗯,这启发了我。和普通文件的标准 I/O 一样,流缓冲区通常是 4K,但这并不意味着文件不能大于 4K,这里也是一样的。再次感谢 :)。我想将其标记为答案

标签: c linux stdio


【解决方案1】:

正如评论中所述,当scanf() 到达第一个缓冲区已满的末尾时,如果它仍然需要更多数据,它会返回系统获取更多数据,可能会多次。缓冲区只是一种便利和优化措施。

【讨论】:

    猜你喜欢
    • 2015-07-01
    • 2016-03-02
    • 2020-09-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-06-06
    相关资源
    最近更新 更多