我面临着完全相同的情况。我怀疑原因是 JVM 内存不足,因为免费的 EC2 实例有 600 MB(cat /proc/meminfo 来验证)。为了寻找线索,我为 Glassfish 域打开了 JVM 日志记录,为此我在<domain>/config/domain.xml 的 JVM 参数中添加了以下几行:
<jvm-options>-XX:LogFile=${com.sun.aas.instanceRoot}/logs/jvm.log</jvm-options>
<jvm-options>-XX:+LogVMOutput</jvm-options>
后来当 Glassfish 关闭时,jvm.log 包含大量消息,如下所示:
<dependency_failed type='unique_concrete_method' ctxk='java/util/ArrayList' x='java/util/ArrayList iterator ()Ljava/util/Iterator;' witness='javax/faces/component/UIComponentBase$ChildrenList' stamp='13211.267'/>
<dependency_failed type='unique_concrete_method' ctxk='java/util/ArrayList' x='java/util/ArrayList iterator ()Ljava/util/Iterator;' witness='javax/faces/component/UIComponentBase$ChildrenList' stamp='13211.267'/>
<dependency_failed type='unique_concrete_method' ctxk='java/util/ArrayList' x='java/util/ArrayList iterator ()Ljava/util/Iterator;' witness='javax/faces/component/UIComponentBase$ChildrenList' stamp='13211.267'/>
我从来没有发现它们的真正含义,但我将它们发布在这里以防有人与我走同样的路并为他们搜索。
最后我查看了/var/log/syslog(我发现的那个实际上名为syslog.1),瞧!我得到了JVM进程内存不足并被杀死的确认:
Dec 20 07:44:44 ip-172-31-33-222 kernel: [1518108.211801] Out of memory: Kill process 22248 (java) score 743 or sacrifice child
Dec 20 07:44:44 ip-172-31-33-222 kernel: [1518108.211833] Killed process 22248 (java) total-vm:1622220kB, anon-rss:447752kB, file-rss:0kB
在我看来,增加交换空间应该可以解决问题。原来EC2交换空间默认为0,所以我分配了1 GB,见How do you add swap to an EC2 instance?
该服务器过去每天都会崩溃,但在启用了交换后,它已经有几周没有崩溃了。